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本 书 作 者 以 自己 1985 年 在 贝尔 实验 室 时 发 表 的 一 篇 论文 为 基础 ， 结 合 自己 的 
工作 经 验 将 这 篇 论文 扩展 成 对 C 程序 员 具 有 珍贵 价值 的 经 典 闭 作 。 本 书 的 出 发 点 
不 是 要 批判 C 语言 ， 而 是 要 帮助 C 程序 员 绕 过 编程 过 程 中 的 陷阱 和 障碍 。 


全 书 分 为 8 章 ， 分 别 从 词法 “陷阱 ”、 语 法 “陷阱 ”、 语 义 “ 陷 阱 ”、 链 接 、 库 函 
数 、 预 处 理 器 、 可 移植 性 缺陷 等 几 个 方面 分 析 了 C 编程 中 可 能 遇 到 的 问题 。 最 
后 ， 作 者 用 一 章 的 篇 幅 给 出 了 和 若干 具有 实用 价值 的 建议 。 


本 书 适合 有 一 定 经 验 的 C 程序 员 阅 读 学 习 ， 即 便 你 是 C 编程 高 手 ， 本 书 也 应 
该 成 为 你 的 案头 必 备 图 书 。 


作者 简介 


Andrew Koenig 


AT&T 大 规模 程序 研发 部 〈 前 贝尔 实验 室 ) 成 员 。 他 从 1986 年 开始 从 事 C 语 言 
的 研究 ，1977 年 加 入 贝尔 实验 室 。 他 编写 了 一 些 早期 的 类 库 ， 并 在 1988 年 组 织 召 
开 了 第 一 个 相当 规模 的 C++ 会 议 。 在 ISO/ANSI C++ 委员 会 成 立 的 1989 年 ， 他 就 加 
入 了 该 委员 会 ， 并 一 直 担任 项 目 编辑 。 他 已 经 发 表 了 100 多 篇 C++ 方面 的 论文 ， 除 
了 写作 本 书 ， 他 还 写作 了 Ruminations on C++ 一 书 ， 而 且 还 应 邀 到 世界 各 地 演 
讲 。 


Andrew Koenig 不 仅 有 着 多 年 的 C++ 开发 、 研 究 和 教学 经 验 ， 还 杀 吴 参与 了 
C++ 的 演化 和 变革 ， 对 C++ 的 变化 和 发 展 起 到 了 重要 的 影响 。 


ne cee 


我 动笔 写作 《C 陷 阱 与 缺陷 》 时 ， 可 没 想到 14 年 后 这 本 书 还 在 印刷 和 发 行 ! 
它 之 所 以 历久 不 嘉 ， 我 想 可 能 是 因为 书 中 道 出 了 C 语 言 编 程 中 一 些 重 要 的 经 验 教 
训 。 即 便 到 了 今天 ， 这 些 教训 也 还 没有 广为人知 。 


C 语 言 中 那些 容易 导致 人 犯错 误 的 特性 ， 往 往 也 正 是 吸引 编程 老手 们 的 特 
性 。 因 此 ， 大 多 数 程序 员 在 成 长 为 C 编 程 高 手 的 道路 上 ， 犯 过 的 错误 总 是 惊人 地 
相似 ! 只 要 C 语 言 还 能 继续 感召 新 的 程序 员 投 身 其 中 ， 这 些 错误 就 还 会 一 犯 再 
犯 。 


大 家 通常 在 阅读 程序 设计 图 书 时 会 发 现 ， 那 些 图 书 的 作者 总 是 认为 ， 要 成 为 
一 个 优秀 的 程序 员 ， 最 重要 的 无 非 是 学 习 一 种 特定 程序 语言 、 孙 数 库 或 者 操作 系 
统 的 细节 ， 而 且 多 多 益 善 。 当 然 ， 这 种 观念 不 无 道理 ， 但 也 有 偏颇 之 处 。 其 实 ， 
和 掌握 细节 并 不 难 ， 一 本 索引 丰富 完 备 的 参考 书 就 已 经 足 疾 ;最 多 可 能 还 需要 一 位 
稍 有 经 验 的 同事 不 时 从 劳 点 拨 ， 指 明 方 向 。 难 的 是 那些 我 们 已 经 了 解 的 东西 ， 如 
何 “ 运 用 之 妙 ， 存 乎 一 心 ”。 


学 习 哪些 是 不 应 该 做 的 ， 倒 不 失 为 一 条 领悟 运 用 之 道 的 路 子 。 程 序 设计 语 
言 ， 就 比如 说 C 吧 ， 其 中 那些 让 精 于 编程 者 党 得 称心 应 手 之 处 ， 也 格外 容易 误 
用 ; 而 经 验 丰 富 的 老手 ， 甚 至 可 以 如 有 “ 先 见 之 明 ” 般 指出 他 们 误 用 的 方式 。 研 究 

种 语言 中 程序 员 容 易 犯 错 之 处 ， 不 仅 可 以 “前 车 之 履 ， 后 车 之 鉴 ”， 还 能 使 我 们 
更 诺 熟 这 种 语言 的 深层 运作 机 制 。 


知悉 本 书 中 文 版 即将 出 版 ， 将 面 对 群 体 更 为 庞大 的 中 国 读者 ， 我 尤为 欣喜 。 
如 果 你 正在 阅读 本 书 ， 我 真挚 地 希望 ， 它 能 对 你 有 所 神 荔 ， 能 为 你 释疑 解 惑 ， 能 
让 你 体会 编程 之 乐 。 


Andrew Koenig 


美国 新 泽 西 州 吉 列 市 


2002 年 10 月 


Preface to the Chinese Edition 


When I first wrote C Traps and Pitfalls, I never dreamed that it would still be in 
print 14 years later! I believe that the reason for this book’s longevity is that it teaches 


some important lessons about C programming that are still not widely understood. 


The aspects of C that invite mistakes are the same aspects that make it attractive for 
expert programmers. Accordingly, most people who set out to become C experts will 


mistakes that will be there to be made as 


make the same mistakes along the way 


long as C continues to attract new programmers. 


If you read a typical programming book, you will probably find that the author 
thinks that the most important part of becoming a good programmer is to learn as many 
details as possible about a particular language, library, or system. There is some truth in 
this notion of course, but it tells only part of the story. Details are easy to learn: All one 
needs is a reference book with a good index, and erhaps a more experienced colleague 
to point one in the right direction once in a while. It is much harder to understand the 


best ways of using what one already knows. 


One way to gain such understanding is to learn what not to do.Programming 
languages, such as C, that are intended to be convenient for experts to use often invite 
misuse in ways that someone with enough experience can predict. By studying the 
mistakes that programmers make most often in such a language, one can not only avoid 


those mistakes, but one can also understand more deeply how the language works. 


I am particularly pleased to learn about the Chinese translation of this book 


because the translation makes it available for the first time to such a large audience. If 


you read this book, I hope that it will help turn your frustration into happiness. 


Andrew Koenig 
Gillette, New Jersey, USA 
October, 2002 
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18 次 印刷 的 奇迹 


一 一 经 典 C 语 言 图 书 C Traps and Pitfalls 简 介 


如 果 有 人 问 我 ， 要 想 学 好 一 门 编程 语言 ， 应 该 阅读 什么 样 的 图 书 ? 坚 无 疑 
问 ， 在 大 多 数 场合 下 ， 我 都 会 向 他 推荐 市 面 上 最 新 出 版 的 图 书 。 原 因 就 是 :以 现 
在 计算 机 领域 内 技术 的 发 展 速 度 ， 几 乎 每 隔 一 段 时 间 ， 我 们 就 需要 对 目 己 现 有 的 
知识 进行 更 新 。 这 样 看 来 ， 使 用 一 本 比较 新 的 图 书 ， 里 面 的 内 容 会 比较 贴近 当前 
技术 的 发 展 ， 因 而 也 就 能 够 让 你 更 容易 掌握 所 要 学 的 东西 。 


但 有 一 本 讲述 C 语 言 的 书 ， 自 出 版 以 来 ， 历 经 14 载 ， 一 直 都 被 各 个 书评 站 点 
(或 书评 人 ) 列 入 “重点 推荐 ”的 清单 中 。 尤 为 夸张 的 是 ，14 年 来 ， 在 它 的 18 次 印 
刷 版 本 中 ， 除 去 第 二 次 印刷 稍微 修改 过 一 些 问 题 ， 以 后 的 16 次 印刷 ， 我 们 居然 发 
现 它 的 内 容 没有 丝 坚 变更 ! 对 于 技术 图 书 ， 我 想 其 精确 性 与 权威 性 也 算是 奇迹 了 
吧 。 


这 就 是 Andrew Koenig 给 我 们 带 来 的 C Traps and Pitfalls © KCK BH- ik 
陷 》) 。 在 C/C++ 领域 中 ，Andy(Andrew 的 上 昵称) 的 名 字 对 于 每 个 人 来 说 绝对 是 
如 雷 贯 耳 。 作 为 一 位 知名 的 专栏 作者 ，Andy《〈 和 他 那 位 同样 大 名 易 易 的 妻子 
Barbara Moo) 已 经 在 各 类 杂志 上 面 发表 了 上 上 百 篇 的 杂志 文章 ， 给 很 多 人 在 技术 进 
步 的 道路 上 带 来 了 极 大 的 帮助 。ACCU 的 Francis Glassborow 对 他 的 评价 是 “Andy 是 
世界 上 最 出 色 的 几 位 C++ 专家 之 一 ”。 


本 书 是 Andy 的 第 一 本 技术 图 书 ， 其 原始 素材 来 自 于 他 在 1986 年 提交 的 同名 技 
术 报 告 。 在 书 中 ， 作 者 针对 C 程 序 在 编译 、 链 接 的 过 程 中 可 能 磁 到 的 种 种 问题 以 
及 编译 、 运 行 环境 对 程序 可 能 带 来 的 影响 等 ， 列 出 了 许多 值得 我 们 注意 的 地 方 。 
按照 作者 本 人 的 观点 ， 以 前 人 碰 到 过 的 问题 来 现身说法 ， 可 以 帮助 你 避免 那些 一 


而 再 、 再 而 三 出 现在 你 的 程序 中 的 问题 。 由 于 是 以 实例 来 描述 作者 《以 及 他 人 ) 
所 储 到 过 的 具体 问题 ， 因 此 本 书 少 去 了 许多 空洞 无 味 的 说 教 ， 虽 然 本 书 篇 幅 不 大 
( 原 书 正文 只 有 区 区 147 页 )， 但 实际 上 ， 它 的 每 个 小 节 、 每 一 段 都 缠 含 着 作者 
《以 及 他 人 ) 大 量 的 经 验 教 训 ， 都 值得 我 们 去 仔细 琢磨 ， 经 常温 习 。 为 此 ， 
Francis Glassborow 说 到 : “从 我 了 解 C 语 言 开始 ， 我 就 将 它 时 时 放 在 手边 ， 经 常 翻 
疝 。?” 作 者 自己 也 在 书 中 毫 不 谦虚 地 说 :“ 如 果 你 是 一 个 程序 员 ， 在 开发 中 经 常用 
到 C 语 言 ， 这 本 书 应 该 成 为 你 的 案头 必 备 图 书 。 即 使 你 已 经 是 专家 级 的 C 语 言 程序 
员 ， 仍 然 有 必要 拥有 一 本 。*” 事 实 上 ，Andy 并 没有 吹 趾 ， 就 书 中 所 列 出 的 种 种 问 
题 ， 我 本 人 也 不 止 一 次 在 自己 的 程序 (也 包括 别人 的 程序 ) 中 发 现 它们 的 踊 迹 ， 
而 且 有 些 问题 出 现 得 还 极为 频繁 。 这 使 我 不 禁 想 到 ， 要 是 我 们 能 够 早 一 些 看 到 这 
本 书 上 提 及 的 问题 ， 那 岂 不 是 可 以 省 去 很 多 开发 时 的 除 错时 间 .……. 


可 能 有 人 会 有 疑问 : 从 书 名 来 看 ， 它 是 一 本 讲述 C 语 言 的 图 书 ， 那 么 对 于 
C++ 的 学 习 者 来 说 ， 它 难道 也 同样 有 价值 吗 ? 另外 ， 现 在 C 语 言 的 ISO/ANSI 标 准 
文档 C99 都 已 经 制订 出 来 了 ， 而 作为 一 本 在 C89 之 前 出 版 的 C 语 言 图 书 ， 它 的 作用 
是 否 还 和 以 前 一 样 大 呢 ? 答案 是 肯定 的 。 本 书 英文 版 连续 18 次 印刷 的 事实 就 是 有 
力 的 证 明 。 实 际 上 ，C++ 和 C 的 区 别 并 不 大 ， 在 C 程 序 中 常 犯 的 错误 通常 在 C++ 程 
序 中 也 经 常 得 以 重 现 ， 因 此 ， 从 这 个 角度 来 说 ，C 语 言 中 的 陷阱 也 常常 就 是 
C++ 语言 中 的 陷阱 。 此 外 ， 虽 然 C99 相 对 于 以 前 的 K&R C 有 了 一 些 变 化 ， 但 在 较 
低层 次 〈 如 词法 、 语 法 ) 上 ， 它 们 几乎 是 没有 差别 的 。 因 此 ， 对 于 本 书 中 所 有 问 
题 的 讨论 ， 几 乎 都 可 以 适用 于 ISO/ANSI C. 


现在 ， 人 民 邮 电 出 版 社 翻译 出 版 C Traps and Pitfalls 一 书 ， 无 疑 是 献 给 C 和 
C++ 程 序 员 的 一 份 厚礼 。 我 本 人 很 采 驻 能 够 担任 本 书 的 技术 审 校 ， 为 本 书 中 文 版 
的 出 版 尽 一 点 绵薄 的 心力 。 感 谢 译 者 的 辛勤 劳动 ， 也 感谢 出 版 社 能 够 给 我 这 样 的 
机 会 ! 希望 本 书 能 够 为 你 的 学 习 带 来 一 些 帮 助 。 
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对 于 经 验 丰 富 的 行家 而 言 ， 得 心 应 手 的 工具 在 初学 时 的 困难 程度 往往 要 超过 
那些 容易 上 手 的 工具 。 刚 刚 接触 飞机 罗 驶 的 学 员 ， 初 航 时 总 是 说 小 慎 微 ， 只 敢 沿 
厦 海 岸 线 来 回 飞 行 ， 等 他 们 稍 有 经 验 ， 就 会 明白 这 样 的 飞行 其 实 是 一 件 多 么 轻松 
的 事 。 初 学 骑 自 行车 的 新 手 ， 可 能 觉得 后 轮 两 侧 的 辅助 轮 很 有 帮助 ， 一 旦 熟练 
了 了， 就 会 及 现 它们 很 是 碍 手 碍 脚 。 


这 种 情况 对 程序 设计 语言 也 是 一 样 。 任 何 一 种 程序 设计 语言 ， 总 存在 一 些 语 
BRE, (RA) HEAR EB IAS CNN ARI. SAMS FE, LEE 
性 虽然 因 程序 设计 语言 的 不 同 而 录 ， 但 对 于 特定 的 一 种 语言 ， 几 乎 每 个 程序 员 都 
在 同样 的 一 些 特性 上 犯 过 错误 ， 吃 过 兰 头 ! 因此 ， 我 也 就 萌生 了 将 这 些 程序 员 易 
犯错 误 的 特性 加 以 收集 、 整 理 的 最 初 念头 。 


我 第 一 次 党 试 收 集 这 类 问题 是 在 1977 年 。 当 时 ， 在 华盛顿 特区 举行 的 一 次 
SHARE (IBM 大 型 机 用 户 组 ) 会 议 上 ， 我 做 了 一 次 题 为 “PL/I 中 的 问题 与 陷 
阱 ”的 发 言 。 做 此 发 言 时 ， 我 刚 从 哥伦比亚 大 学 调 至 AT&T 的 贝尔 实验 室 。 在 哥 
伦比 亚 大 学 我 们 主要 的 开发 语言 是 PL/I[， 而 贝尔 实验 室 中 主要 的 开发 语言 却 是 C。 
在 贝尔 实验 室 工作 的 10 年 间 ， 我 积累 了 丰富 的 经 验 ， 深 请 C 程 序 员 (也 包括 我 本 
KD 在 开发 时 如 果 一 知 半 解 将 会 遇 到 多 少 麻 烦 。 


1985 年 ， 我 开始 收集 有 关 C 语 言 的 此 类 问题 ， 并 在 年 底 将 结果 整理 后 作为 一 
篇 内 部 论文 有 发表。 这 篇 论文 所 引发 的 回应 大 大 出 乎 我 的 意料 ， 共 有 2000 多 人 向 贝 
尔 实验 室 的 图 书馆 索取 该 论文 的 副本 ! 我 由 此 确信 ， 有 必要 进一步 扩充 该 论文 的 
内 容 ， 于 是 就 写成 了 现在 读者 所 看 到 的 这 本 书 。 


本 书 力图 通过 揭示 一 般 程 序 员 甚至 是 经 验 老道 的 职业 程序 员 如 何在 编程 中 犯 
错误 、 摔 跟头 ， 以 提倡 和 鼓励 预防 性 的 程序 设计 。 这 些 错 误 实 际 上 一 旦 被 程序 员 
真正 认识 和 理解 ， 并 不 难 避 免 。 因 此 ， 本 书 阐 述 的 重点 不 是 一 般 原 则 ， 而 是 一 个 
个 具体 的 例子 。 


如 果 你 是 一 个 程序 员 并 且 开 发 中 真正 用 到 C 语 言 来 解决 复杂 问题 ， 本 书 应 该 
成 为 你 的 案头 必 备 图 书 。 即 使 你 已 经 是 一 个 专家 级 的 C 语 言 程序 员 ， 仍 然 有 必要 
拥有 这 本 书 ， 很 多 读 过 本 书 早期 手稿 的 专业 C 程 序 员 常 党 感叹:“ 束 在 上 星期 我 还 
遇 到 这 样 一 个 Bug! ”如 果 你 正在 教授 C 语 言 课程 ， 本 书 苗 无 疑问 应 该 成 为 你 同学 
生 推 荐 的 首选 补充 阅读 材料 。 


本 书 不 是 什么 


本 书 不 是 对 C 语 言 的 批评 。 程 序 员 无 论 使 用 何 种 程序 设计 语言 ， 都 有 可 能 遇 
到 厅 烦 。 本 书 浓缩 了 作者 长 达 10 年 的 C 语 言 开发 经 验 ， 集 中 冰 述 了 C 语 言 中 各 种 问 
题 和 “陷阱 >， 目 的 是 希望 程序 员 读 者 能 够 从 中 吸取 我 本 人 以 及 我 所 见 过 的 其 他 人 
所 犯错 误 的 经 验 教训 。 


本 书 不 是 一 本 “ 昌 饪 菜谱 ”。 我 们 无 法 通过 详尽 的 指导 说 明 来 完全 避免 错误 。 
如 果 可 行 的 话 ， 那 么 所 有 的 交通 事故 都 可 以 通过 在 路 旁 刷 上 “人 小心 雪 驶 ”的 标语 来 
杜绝 。 对 一 般 人 而 言 ， 最 有 效 的 学 习 方式 是 从 感性 的 、 活 生生 的 事例 中 学 习 ， 比 
如 自己 的 杀身 经 历 或 者 他 人 的 经 验 教训 。 而 且 ， 哪 怕 只 是 明白 了 一 种 特定 的 错误 
是 如 何 发 生 的 ， 就 已 经 在 将 来 避免 该 错误 的 路 上 迈 了 一 大 步 。 


本 书 并 不 打算 教 你 如 何 用 C 语 言 编程 (可 见 Kernighan 和 Ritchie: The C 
Programming Language， 第 2 版 ，Prentice-Hall，1988) ， 也 不 是 一 本 C 语 言 参考 手 
册 〈( 可 见 Harbison 和 Steele: C: A Reference Manual, ‘2h, Prentice-Hall, 

1987) 。 本 书 未 提 及 数据 结构 与 算法 〈 可 见 Van Wyk: Data Structures And C 
Programs, Addison-Wesley, 1988) ， 仅 仅 简略 介绍 了 可 移植 性 〈 可 见 


Horton: How To Write Portable Programs In C, Prentice-Hall, 1989) 和 操作 系统 
接口 (可见 Kermnighan 和 Pike: The Unix Programming Environment, Prentice-Hall, 
1984) 。 本 书 所 涉及 的 问题 均 来 自 编 程 实践 ， 并 适当 作 了 简化 (如 果 希 望 读 到 一 
些 “ 控 空心 思 ” 设 计 出 来 ， 专 门 让 你 绞 尽 脑汁 的 C 语 言 难题 ， 可 见 Feuer: The C 
Puzzle Book, Prentice-Hall, 1982) 。 本 书 既 不 是 一 本 字典 ， 也 不 是 一 本 百科 全 
书 ， 我 力图 使 其 精简 短小 ， 以 鼓励 读者 能 够 阅读 全 书 。 


读者 的 参与 和 页 献 


可 以 肯定 ， 我 遗漏 了 某 些 值得 注意 的 问题 。 如 果 你 发 现 了 一 个 C 语 言 问题 而 
本 书 又 未 提 及 ， 请 通过 Addison-Wesley 出 版 社 与 我 联系 。 在 本 书 的 下 一 版 中 ， 我 
很 有 可 能 引用 你 的 发 现 ， 并 且 辐 你 致谢 。 


关于 ANSI C 


在 写作 本 书 时 ，ANSI C 标 准 尚 未 最 后 定案 。 严 格 地 说 ， 在 ANSI 委 员 会 完成 
其 工作 之 前 , “ANSI C” 的 提 法 从 技术 上 而 言 是 不 正确 的 。 而 实际 上 ，ANSI 标 准 
化 工作 大 体 已 经 尘埃 落 定 ， 本 书 提 及 的 有 关 ANSI C 标 准 内 容 基 本 上 不 可 能 有 所 变 
动 。 很 多 C 编 译 器 甚至 已 经 实现 了 ANSI 委 员 会 所 考虑 的 对 C 语 言 的 大 部 分 重大 改 
进 。 


无 须 担 心 你 使 用 的 C 编 译 器 不 文 持 书 中 出 现 的 ANSI 标 准 函 数 语法 ， 它 并 不 会 
妨碍 你 理解 例子 中 真正 重要 的 内 容 ， 而 且 书 中 提 及 的 程序 员 易 犯错 误 其 实 与 何 种 
版 本 的 C 编 译 器 并 无 太 大 关系 。 


致谢 


本 书 中 间 题 的 收集 整理 工作 绝 非 一 人 之 力 可 以 完成 。 以 下 诸位 都 向 我 指出 过 


C 语 言 中 的 特定 问题 ， 他 们 是 Steve Bellovin (6.3 节 ) ~ Mark Brader (1.1 节 ) 、 
Luca Cardelli (4.477) ~ Larry Cipriani (2.3 节 ) 、Guy Harris 和 Steve Johnson (2.2 
W) 、Phil Karn (2.277) 、Dave Kristol (7.5 节 ) ~ George W. Leach (1.177) 、 
Doug McIlroy (2.377) 、Barbara Moo (7.2 节 ) 、Rob Pike (1.177) 、Jim 

Reeds 〈3.6 节 ) 、Dennis Ritchie (2.277) ~ Janet Sirkis (5.2777) 、Richard 
Stevens (2.543) 、Bjarne Stroustrup 〈2.3 节 ) 、Ephraim Vishnaic (1.477) ， 以 及 
一 位 自愿 要 求 隐 去 姓名 的 人 《2.3 节 ) 。 为 简短 起 见 ， 对 于 同一 个 问题 此 处 仅仅 列 
出 了 第 一 位 向 我 指出 该 问题 的 人 。 我 认为 这 些 错误 绝 不 是 凭空 腾 造 出 来 的 ， 而 且 
即使 是 ， 我 想 也 没有 人 愿意 承认 。 人 至 少 这 些 错误 我 本 人 几乎 都 犯 过 ， 而 且 有 的 还 
不 止 犯 过 一 次 。 


在 书稿 编辑 方面 许多 有 用 的 建议 来 自 Steve Bellovin、Jim Coplien, Marc 
Donner. Jon Forrest. Brian Kernighan. Doug McIlroy, Barbara Moo, Rob 
Murray. Bob Richton, Dennis Ritchie, Jonathan Shapiro， 以 及 一 些 未 透露 姓名 的 
审阅 人 员 。Lee McMahon 与 Ed Sitar 为 我 指出 了 早期 手稿 中 的 许多 录入 错误 ， 使 我 
避免 了 一 旦 成 书后 将 要 遇 到 的 很 多 二 炊 。Dave Prosser 为 我 指明 了 许多 ANSI CH 
的 细微 之 处 。Brian Kernighan 提 供 了 极 有 价值 的 排版 工具 和 帮助 。 


与 Addison-Wesley 出 版 社 合 作 是 一 件 愉快 的 事情 ， 感 谢 Jim DeWolf、Mary 
Dyer, Lorraine Ferrier. Katherine Harutunian, Marshall Henrichs, Debbie 
Lafferty. Keith Wollman 和 Helen Wythe。 当 然 ， 他 们 也 从 一 些 并 不 为 我 所 知 的 人 
那里 得 到 了 帮助 ， 使 本 书 最 终 得 以 出 版 ， 在 此 一 并 致谢 。 


我 需要 特别 感谢 AT&T 贝 尔 实 验 室 的 管理 层 ， 包 括 Steve Chappell. Bob 
Factor, Wayne Hunt, Rob Murray. Will Smith, Dan Stanzione 和 Eric Sumner, {th 
们 开明 的 态度 和 文 持 使 我 得 以 写作 本 书 。 


本 书 书 名 受到 Robert Sheckley 的 科 弥 小 说 选集 的 启发， 其 书 名 是 The People 


Trap and Other Pitfalls, Snares, Devices and Delusions (as well as Two Sniggles 


and a Contrivance) (1968 年 由 Dell Books 出 版 ) 。 


资源 与 文 持 


本 书 由 异步 社区 出 品 ， 社 区 Chttps://www.epubit.com/) 为 您 提供 相关 资源 和 
后 续 服 务 。 


提交 勘误 


作者 和 编辑 尽 最 大 努力 来 确保 书 中 内 容 的 准确 性 ， 但 难免 会 存在 芷 漏 。 欢 迎 
您 将 发 现 的 问题 反馈 给 我 们 ， 帮 助 我 们 提升 图 书 的 质量 


当 您 发 现 错误 时 ， 请 登录 异步 社区 ， 按 书 名 搜索 ， 进 入 本 书页 面 ， 单 击 "提交 
勘误 ”， 输 入 勘误 信息 ， 单 击 “提交 "按钮 即 可 。 本 书 的 作者 和 编辑 会 对 您 提交 的 其 
误 进行 审核 ， 确 认 并 接受 后 ， 您 将 获 赠 异 步 社区 的 100 积 分 。 积 分 可 用 于 在 异步 

社区 兑换 优惠 券 、 样 书 或 奖品 。 


与 我 们 联系 
我 们 的 联系 邮箱 是 contact@epubit.com.cn。 


如 果 您 对 本 书 有 任何 疑问 或 建议 ， 请 您 发 邮件 给 我 们 ， 并 请 在 邮件 标题 中 注 
明 本 书 书 名 ， 以 便 我 们 更 高 效 地 做 出 反馈 。 


如 果 您 有 兴趣 出 版 图 书 、 录 制 教学 视频 ， 或 者 参与 图 书 翻译 、 技 术 审 校 等 工 
作 ， 可 以 发 邮件 给 我 们 ;有意 出 版 图 书 的 作者 也 可 以 到 异步 社区 在 线 投稿 (直接 


访问 www.epubit.com/selfpublish/submission 即 可 ) 。 


如 果 您 所 在 学 校 、 培 训 机 构 或 企业 ， 想 批量 购买 本 书 或 异步 社区 出 版 的 其 他 
图 书 ， 也 可 以 发 邮件 给 我 们 。 


如 果 您 在 网 上 发 现 有 针对 异步 社区 出 品 图 书 的 各 种 形式 的 盗版 行为 ， 包 括 对 
图 书 全 部 或 部 分 内 容 的 非 授权 传播 ， 请 您 将 怀疑 有 侵权 行为 的 链接 发 邮件 给 我 
们 。 您 的 这 一 举动 是 对 作者 权益 的 保护 ， 也 是 我 们 持续 为 您 提供 有 价值 的 内 容 的 
动力 之 源 。 


关于 异步 社区 和 异步 图 书 


“异步 社区 ”是 人 民 邮 电 出 版 社 旗下 IT 专 业 图 书社 区 ， 致 力 于 出 版 精品 IT 技 术 
图 书 和 相关 学 习 产 品 ， 为 作 译 者 提供 优质 出 版 服务 。 异 步 社区 创办 于 2015 年 8 
月 ， 提 供 大 量 精 品 IT 技术 图 书 和 电子 书 ， 以 及 高 品质 技术 文章 和 视频 课程 。 更 多 
详情 请 访问 异步 社区 官网 https:/www.epubit.com。 


“异步 图 书 ” 是 由 异步 社区 编辑 团队 集 划 出 版 的 精品 工 专 业 图 书 的 品牌 ， 依 托 
于 人 民 邮 电 出 版 社 近 30 年 的 计算 机 图 书 出 版 积累 和 专业 编辑 团队 ， 相 关 图 书 在 封 
面 上 印 有 异步 图 书 的 LOGO。 和 异步 图 书 的 出 版 领域 包括 软件 开发 、 大 数据 、AT、 
测试 、 前 端 、 网 络 技术 等 。 


微 信 服务 号 


第 0 章 “导读 


我 的 第 一 个 计算 机 程序 写 于 1966 年 ， 是 用 Fortran 语 言 开发 的 。 该 程序 需要 完 
成 的 任务 是 计算 并 打印 输出 10000 以 内 的 所 有 Fibonacci 数 ， 也 就 是 一 个 包括 1，1， 


2，3，5，8，13，21，... 等 元 素 的 数列 ， 其 中 第 2 个 数字 之 后 的 每 个 数字 都 是 前 
两 个 数字 之 和 。 当 然 ， 写 程序 代码 很 难 第 一 次 就 顺利 通过 编译 : 


I = 6 

] = 6 

K = 1 
1 PRINT 10,K 

I=] 

J=K 

K=I+J 

IF (K - 10000) 1, 1, 2 
2 CALL EXIT 
10 FORMAT(I16) 


Fortran 程 序 员 很 容易 发 现 上 面 这 段 代 码 遗 漏 了 一 个 END 语 句 。 当 我 添上 END 
语句 之 后 ， 程 序 还 是 不 能 通过 编译 ， 编 译 器 的 错误 消息 也 让 人 迷惑 不 解 ， ERROR 
6. 


通过 仔细 查阅 编译 器 参考 手册 中 对 错误 消息 的 说 明 ， 我 最 后 终于 明白 了 问题 
所 在 : 我 使 用 的 Fortran 编 译 器 不 能 处 理 4 位 数 以 上 的 整 型 常量 。 将 上 面 这 段 代 码 中 
的 10000 改 为 9999， 程 序 就 顺利 通过 了 编译 。 


我 的 第 一 个 C 程 序 写 于 1977 年 。 当 然 ， 第 一 次 还 是 没有 得 到 正确 结 


#include <stdio.h> 


main() 


printf("Hello world"); 


这 段 代 码 虽 然 在 编译 时 一 次 通过 ， 但 是 程序 执行 的 结果 看 上 去 有 点 奇怪 。 
端 输出 差不多 就 是 下 面 这 样 : 
% CC prog.c 


% a.out 
Hello wor1d% 


这 里 的 % 字 符 是 系统 提示 符 ， 操 作 系统 用 它 来 提示 用 户 输入 。 因 为 在 程序 中 
没有 写 明 “Hello world” 消 息 之 后 应 该 换行 ， 所 以 系统 提示 符 % 直 接 出 现在 输出 
的 “Hello world” 消 息 之 后 。 这 个 程序 中 还 有 一 个 更 加 难以 察觉 的 错误 ， 将 在 3.10 节 
加 以 讨论 。 


上 面 提 到 的 两 个 程序 中 所 出 现 的 错误 ， 是 有 着 实质 区 别 的 两 种 不 同类 型 的 错 

。 在 Fortran 程 序 的 例子 中 出 现 了 两 个 错误 ， 但 是 这 两 个 错误 都 能 够 被 编译 器 检 
ae en 至 少 从 计算 机 的 角度 来 看 它 没 有 
错误 。 因 此 ，C 程 序 顺利 通过 了 编译 ， 没 有 报告 任何 警告 或 错误 消 轧 。 计 算 机 严 
格 地 按照 我 写 明 的 程序 代码 来 执行 ， 但 结果 并 不 是 我 真正 希望 得 到 的 。 


本 书 所 要 集中 讨论 的 是 第 二 类 问题 A te dd 的 
方式 执行 。 更 进一步 ， 本 书 的 讨论 限定 在 C 语 言 程 序 中 可 能 类 错误 的 方 
式 。 例 如 ， 考 虑 下 面 这 段 代 码 : 


int i; 

int a[N]; 

for (i = ð; i <= N; i++) 
ali] = ð; 


这 段 代 码 的 作用 是 初始 化 一 个 N 元 数组 ， 但 是 在 很 多 C 编 译 器 中 ， 它 将 会 陷入 
一 个 死 循环 ! 3.6 节 讨论 了 导致 这 种 情况 的 原因 。 


程序 设计 错误 实际 上 反映 的 是 程序 与 程序 员 这 两 者 对 该 程序 的 “心智 模式 ”D 
的 相 异 之 处 。 就 程序 错误 的 本 性 而 言 ， 我 们 很 难 给 它们 进行 恰当 的 分 类 。 对 于 一 
个 程序 错误 ， 可 以 从 不 同 层面 采用 不 同方 式 进行 考察 。 根 据 程序 错误 与 考察 程序 


的 方式 之 间 的 相关 性 ， 我 尝试 着 对 程序 错误 进行 了 划分 。 


译注 心 : 


心智 模式 (mental model) 在 彼得 : 圣 吉 的 《第 五 项 修炼 一 一 学 习 型 组 织 的 艺 
术 与 实务 》 〈 上 海 三 联 书店 ，1998 年 第 2 版 ) 中 也 有 提 到 ， 被 解释 为 “人 们 深 植 心 
中 ， 对 于 周遭 世界 如 何 运 作 的 看 法 和 行为 ”。Howard Gardner 在 研究 认 知 科学 的 一 
本 著作 《心灵 的 新 科学 》 (The Mind’s New Science) 中 认为 ， 人 们 的 心智 模式 决 
定 了 人 们 如 何 认 识 周遭 世界 。《 列 子 》 一 书 中 有 个 典型 的 故事 ， 说 有 个 人 遗失 了 
一 把 戎 头 ， 他 怀疑 是 邻居 孩子 偷 的 ， 蜡 中 观察 他 的 行为 ， 怎 么 看 怎么 像 偷 佐 头 的 
As 后 来 他 在 自己 家 中 找到 了 遗失 的 和 佐 头 ， 再 碰 到 邻居 的 孩子 时 ， 怎 么 看 也 不 像 
会 是 偷 他 径 头 的 人 了 。 


从 较 低 的 层面 考察 ， 程 序 是 由 符号 〈token) 序列 所 组 成 的 ， 正 如 一 本 书 是 由 
一 个 一 个 字 词 所 组 成 的 一 样 。 将 程序 分 解 成 符号 的 过 程 ， 称 为 “词法 分 析 ”。 第 1 章 
考察 在 程序 被 词法 分 析 器 分 解 成 各 个 符号 的 过 程 中 可 能 出 现 的 问题 。 


组 成 程序 的 这 些 符号 ， 又 可 以 看 成 是 语句 和 声明 的 序列 ， 就 好 像 一 本 书 可 以 
看 成 是 由 单词 进一步 结合 而 成 的 句子 所 组 成 的 集合 。 无 论 是 对 于 书 而 言 ， 还 是 对 
于 程序 而 言 ， 符 号 或 者 单词 如 何 组 成 更 大 的 单元 (对 于 前 者 是 语句 和 声明 ， 对 于 
后 者 是 句子 ) 的 语法 细节 最 终 决 定 了 语义 。 如 果 没 有 正确 理解 这 些 语法 细节 ， 将 
会 出 现 怎 样 的 错误 呢 ? 第 2 章 就 此 进行 了 讨论 。 


第 3 章 处 理 有 关 语 义 误 解 的 问题 : 程序 员 的 本 意 是 希望 表示 茶 种 事物 ， 而 实 
际 表示 的 却 是 另外 一 种 事物 。 在 这 一 章 中 我 们 假定 程序 员 对 词法 细节 和 语法 细节 
的 理解 没有 问题 ， 因 此 着 重 讨论 语义 细 市 。 


第 4 章 注 意 到 这 样 一 个 事实 : C 程 序 经 常 是 由 徊 干 个 部 分 组 成 ， 它 们 分 别 进 行 
编译 ， 最 后 再 整合 起 来 。 这 个 过 程 称 为 “链接 *"， 是 程序 和 其 支持 环境 之 间 关 系 的 


一 部 分 。 


程序 的 支持 环境 包括 某 组 库 函 数 library routine) 。 虽 然 严格 说 来 库 函数 并 
不 是 语言 的 一 部 分 ， 但 是 它 对 任何 一 个 有 用 的 程序 都 非常 重要 。 尤 其 是 ， 有 些 库 
函数 几乎 会 在 每 个 C 程 序 中 都 要 用 到 。 对 这 些 库 函数 的 误 用 可 以 说 是 五 花 八 门 ， 
因此 值得 在 第 5 章 中 专门 讨论 。 


在 第 6 章 ， 我 们 还 注意 到 ， 由 于 C 预 处 理 器 的 介入 ， 实 际 运 行 的 程序 并 不 是 最 
初 编写 的 程序 。 虽 然 不 同 预 处 理 器 的 实现 存在 或 多 或 少 的 差异 ， 但 是 大 部 分 特性 
是 各 种 预 处 理 器 都 支持 的 。 第 6 章 讨论 了 与 这 些 特性 有 关 的 有 用 内 容 。 


第 7 章 讨论 了 可 移植 性 问题 ， 也 就 是 为 什么 在 一 个 实现 平台 上 能 够 运行 的 程 
序 却 无 法 在 男 一 个 平台 上 运行 。 当 牵涉 到 可 移植 性 时 ， 哪 怕 是 非常 简单 的 类 似 整 
数 的 算术 运算 这 样 的 事情 ， 其 困难 程度 也 常常 会 出 人 意料 。 


第 8 章 提 供 了 有 关 预 防 性 程序 设计 的 一 些 建议 ， 还 给 出 了 其 他 章节 的 练习 解 
答 。 


最 后 ， 附 录 讨论 了 3 个 常用 的 却 普 裔 被 误解 的 库 函 数 。 


练习 0-1 你 是 否 愿意 购买 厂家 所 生产 的 一 辆 返修 率 很 高 的 汽车 ?如 果 厂 家 声 
明 对 它 已 经 做 出 了 改进 ， 你 的 态度 是 否 会 改变 ? 用 户 为 你 找 出 程序 中 的 bug， 你 
真正 损失 的 是 什么 ? 


练习 0-2 ”修建 一 个 100 英 尺 ( 约 30.5 米 ) 长 的 护栏 ， 护 栏 的 栏杆 之 间 相 距 10 
英尺 〈 约 3.05 米 ) ， 需 要 用 到 多 少 根 栏杆 ? 


练习 0-3 在 亮 饪 时 你 是 否 失手 用 菜刀 切 伤 过 自己 的 手 ? 怎样 改进 菜刀 会 让 使 
用 更 安全 ? 你 是 否 愿 意 使 用 这 样 一 把 经 过 改良 的 菜刀 ? 


第 1 章 “词法 < 陷阱 


在 阅读 一 个 英文 句子 时 ， 我 们 并 不 去 考虑 组 成 这 个 句子 的 单词 中 单个 字母 的 
含义 ， 而 是 把 单词 作为 一 个 整体 来 理解 。 确 实 ， 字 母 本 身 并 没有 什么 意义 ， 我 们 
总 是 将 字母 组 成 单词 ， 然 后 给 单词 赋予 一 定 的 意义 。 


PS ATS 


对 于 用 C 语 言 或 其 他 语言 编写 的 程序 ， 道 理 也 是 一 样 的 。 程 序 中 的 单个 字符 
孤立 来 看 并 没有 什么 意义 ， 只 有 结合 上 下 文才 有 意义 。 因 此 ， 在 p->s = "->"; 这 个 
语句 中 ， 两 处 出 现 的 '-' 字 符 的 意义 大 相 径 庭 。 更 精确 地 说 ， 上 式 中 出 现 的 两 个 - 字 
符 分 别 是 不 同 符号 的 组 成 部 分 : 第 一 个 -字符 是 符号 -> 的 组 成 部 分 ， 而 第 二 个 -' 字 
符 是 一 个 字符 串 的 组 成 部 分 。 此 外 ， 符 号 -> 的 含义 与 组 成 该 符号 的 字符 '-' 或 字 
符 '>' 的 含义 也 完全 不 同 。 


术语 “符号 ”(token) 指 的 是 程序 的 一 个 基本 组 成 单元 ， 其 作用 相当 于 一 个 句 
子 中 的 单词 。 从 某 种 意义 上 说 ， 一 个 单词 无 论 出 现在 哪个 句子 中 ， 它 代表 的 意思 
都 是 一 样 的， 是 一 个 表 义 的 基本 单元 。 与 此 类 似 ， 符 号 就 是 程序 中 的 一 个 基本 信 
息 单元 。 而 组 成 符号 的 字符 序列 就 不 同 ， 同 一 组 字符 序列 在 某 个 上 下 文 环境 中 属 
于 一 个 符号 ， 而 在 另 一 个 上 下 文 环境 中 可 能 属于 完全 不 同 的 另 一 个 符号 。 


译注 : 


如 上 面 的 字符 "和 字符 > 组 成 的 字符 序列 ->， 在 不 同 的 上 下 文 环境 中 ， 一 个 
代表 -> 运算 符 ， 一 个 代表 字符 串 "->"。 


编译 器 中 负责 将 程序 分 解 为 一 个 一 个 符号 的 部 分 ， 一 般 称 为 “词法 分 析 器 ”。 


再 看 下 面 一 个 例子 : 


if (x > big) big = x; 
这 个 语句 的 第 一 个 符号 是 C 语 言 的 关键 字 让 ， 紧 接着 下 一 个 符号 是 左 括号 ， 再 
下 一 个 符号 是 标识 符 x， 再 下 一 个 是 大 于 号 ， 再 下 一 个 是 标识 符 big， 以 此 类 推 。 


在 C 语 言 中 ， 符 号 之 间 的 空 日 (包括 空格 符 、 制 表 符 或 换行 符 ) 将 被 忽略 ， 因 此 
上 面 的 语句 还 可 以 写成 : 


+ 


ve X Il Oo ORY ato 
ga ga 


本 章 将 探讨 符号 和 组 成 符号 的 字符 间 的 关系 ， 以 及 有 关 符 号 含义 的 一 些 常见 


误解 。 


1.1 = 不 同 于 == 


由 Algol 派 生 而 来 的 大 多 数 程 序 设 计 语 言 ， 例 如 Pascal 和 Ada， 以 符号 := 作为 赋 
值 运算 符 ， 以 符号 = 作为 比较 运算 符 。 而 C 语 言 使 用 的 是 男 一 种 表示 法 : 以 符号 = 
作为 赋值 运算 ， 以 符号 = = 作为 比较 。 一 般 而 言 ， 赋 值 运算 相对 于 比较 运算 出 现 得 
更 频繁 ， 因 此 字符 数 较 少 的 符号 = 就 被 赋予 了 更 常用 的 含义 一 一 赋值 操作 。 此 
外 ， 在 C 语 言 中 赋值 符号 被 作为 一 种 操作 符 对 待 ， 因 而 重复 进行 赋值 操作 《如 
a=b=c) 可 以 很 容易 地 书写 ， 并 且 赋 值 操作 还 可 以 被 嵌入 到 更 大 的 表达 式 中 。 


这 种 使 用 上 的 便利 性 可 能 导致 一 个 潜在 的 问题 : 程序 员 本 意 是 作 比 较 运 算 ， 
却 可 能 无 意 中 误 写成 了 赋值 运算 。 比 如 下 例 ， 该 语句 本 意 似乎 是 要 检查 x 是 否 等 
Ty: 


if (x = y) 
break; 


而 实际 上 是 将 y 的 值 赋 给 了 x， 然 后 检查 该 值 是 否 为 零 。 再 看 下 面 一 个 例子 ， 
本 例 中 循环 语句 的 本 意 是 跳 过 文件 中 的 空格 符 、 制 表 符 和 换行 号 : 


while (c = ' ' || c == '\t' || c == '\n') 
c = getc (f); 


由 于 程序 员 在 比较 字符 '' 和 变量 c 时 ， 误 将 比较 运算 符 = = 写成 了 赋值 运算 符 
=， 而 赋值 运算 符 = 的 优先 级 要 低 于 逻辑 运算 符 ‖， 因 此 实际 上 是 将 以 下 表达 式 的 
IEIRA T c: 


ee le = en [| e n’ 


因为 '' 不 等 于 零 ('' 的 ASCII 码 值 为 ?2) ， 那 么 无 论 变量 c 此 前 为 何 值 ， 上 述 
表达 式 求 值 的 结果 都 是 1， 所 以 循环 将 一 直 进 行 下 去 ， 直 到 整个 文件 结束 。 文 件 
结束 之 后 循环 是 否 还 会 进行 下 去 ， 要 取决 于 getc 库 函数 的 具体 实现 ， 即 该 函数 在 


文件 指针 到 达 文 件 结尾 之 后 是 否 还 允许 继续 读 取 字 符 。 如 果 人 允许 继续 读 取 字 符 ， 
那么 循环 将 一 直 进 行 ， 从 而 成 为 一 个 死 循环 。 


东 些 C 编 译 吉 在 发 现形 如 el = e2 的 表达 式 出 现在 循环 语句 的 条 件 判断 部 分 
时 ， 会 给 出 警告 消息 以 提醒 程序 员 。 当 确实 需要 对 变量 进行 赋值 并 检查 该 变量 的 
新 值 是 否 为 0 时 ， 为 了 避免 来 自 该 类 编译 吉 的 警告 ， 我 们 不 应 该 简单 关闭 警告 选 
项 ， 而 应 该 显 式 地 进行 比较 。 也 就 是 说 ， 下 例 


if (x = y) 
foo(); 


应 该 写作 : 


if ((x = y) != ð) 
foo(); 


这 种 写法 也 使 得 代码 的 意图 一 目 了 然 。 至 于 为 什么 要 用 括号 把 x = y 括 起 来 ， 


2.2 节 将 讨论 这 个 问题 。 


前 面 一 直 谈 的 是 把 比较 运算 误 写 成 赋值 运算 的 情形 ， 此 外 ， 如 果 把 赋值 运算 
误 写 成 比较 运算 ， 同 样 会 造成 混 消 : 


if es nae: 0)) < @) 

在 本 例 中 ， 如 果 函 数 open 执 行 成 功 ， 将 返回 0 或 者 正 数 ， 而 如 果 函 数 open 执 行 
失败 ， 将 返回 -1。 上 面 这 段 代码 的 本 意 是 将 函数 open 的 返回 值 存储 在 变量 filedesc 
之 中 ， 然 后 通过 比较 变量 fledesc 是 否 小 于 0 来 检查 函数 open 是 否 执行 成 功 。 但 
是 ， 此 处 的 == 本 应 是 =。 而 按照 上 面 代码 中 的 写法 ， 实 际 进行 的 操作 是 比较 函数 
open 的 返回 值 与 变量 fedesc。 然 后 检查 比较 的 结果 是 否 小 于 0， 因 为 比较 运算 符 
== 的 结果 只 可 能 是 0 或 1， 永 远 不 可 能 小 于 0， 所 以 函数 error0 将 没有 机 会 被 调用 。 
如 果 代 码 被 执行 ， 似 乎 一 切 正常 ， 除 了 变量 fedesc 的 值 不 再 是 函数 open 的 返回 值 
(事实 上 ， 甚 至 完全 与 函数 open 无 关 ) 。 某 些 编译 器 在 遇 到 这 种 情况 时 ， 会 警告 


毕竟 警告 消息 可 以 被 忽 


与 0 比较 无 效 。 但 是 ， 程 序 员 不 能 指望 靠 编 译 器 来 提醒 ， 
略 ， 而 且 并 不 是 所 有 编译 器 都 具备 这 样 的 功能 。 


1.2 && 和 | 不 同 于 && Fi | 


很 多 其 他 语言 都 使 用 = 作为 比较 运算 符 ， 因 此 很 容易 误 将 赋值 运算 符 = 写 成 比 
较 运 算 符 = =。 同 样 ， 将 按 位 运算 符 & 与 逻辑 运算 符 && 调 换 ， 或 者 将 按 位 运算 符 | 
与 逻辑 运算 符 | 调换， 也 是 很 容易 犯 的 错误 。 特 别 是 C 语 言 中 按 位 与 运算 符 & 和 按 
位 或 运算 符 | ， 与 某 些 其 他 语言 中 的 按 位 与 运算 符 和 按 位 或 运算 符 在 表现 形式 上 
完全 不 同 〈 如 Pascal 语 言 中 分 别 是 and 和 or) ， 这 更 容易 让 程序 员 因 为 受到 其 他 语 
言 的 影响 而 犯错 。 关 于 这 些 运算 符 精 确 含义 的 讨论 见 3.8 节 。 


1.3 词法 分 析 中 的 “ 贫 心 法 ?” 


C 语 言 的 某 些 符号 ， 例 如 /、* 、 和 =， 只 有 一 个 字符 ， 称 为 单字 符 符 号 。 而 C 
语言 中 的 其 他 符号 ， 例 如 /* 和 = = ， 以 及 标识 符 ， 包 括 了 多 个 字符 ， 称 为 多 字符 
符号 。 当 C 编 译 器 读 入 一 个 字符 /后 又 跟 了 一 个 字符 '"*， 那 么 编译 器 就 必须 做 出 判 
Wr: 是 将 其 作为 两 个 分 别 的 符号 对 待 ， 还 是 合 起 来 作为 一 个 符号 对 待 。C 语 言 对 
这 个 问题 的 解决 方案 可 以 归纳 为 一 个 很 简单 的 规则 :每 一 个 符号 应 该 包含 尽 可 能 
多 的 字符 。 也 就 是 说 ， 编 译 器 将 程序 分 解 成 符号 的 方法 是 ， 从 左 到 右 一 个 字符 一 
个 字符 地 读 入 ， 如 果 该 字符 可 能 组 成 一 个 符号 ， 那 么 再 读 入 下 一 个 字符 ， 判 断 已 
经 读 入 的 两 个 字符 组 成 的 字符 串 是 否 可 能 是 一 个 符号 的 组 成 部 分 ， 如 果 可 能 ， 继 
续 读 入 下 一 个 字符 ， 重 复 上 述 判 断 ， 直 到 读 入 的 字符 组 成 的 字符 串 已 不 再 可 能 组 
成 一 个 有 意义 的 符号 。 这 个 处 理 策略 有 时 被 称 为 “贪心 法 "， 或 者 更 口语 化 一 点 ， 
称 为 “大 嘴 法 ”。Kernighan 与 Ritchie 对 这 个 方法 的 表述 如 下 , “如 果 ( 编 译 器 的 ) 输 
入 流 截 至 某 个 字符 之 前 都 已 经 被 分 解 为 一 个 个 符号 ， 那 么 下 一 个 符号 将 包括 从 该 
字符 之 后 可 能 组 成 一 个 符号 的 最 长 字符 串 ”。 


号 的 中 间 不 能 能 有 空白 〈 空 格 
符 、 制 表 符 和 换行 符 ) 。 例 如 ，== 是 单个 符号 ， 而 == 则 是 两 个 符号 ， 下 面 的 表 
达 式 


a---b 


与 表达 式 


的 含义 相同 ， 而 与 


T, 


的 含义 不 同 。 同 样 ， 如 果 / 是 为 判断 下 一 个 符号 而 读 入 的 第 一 个 字符 ， 而 /之 
后 紧 接着 *， 那 么 无 论 上 下 文 如 何 ， 这 两 个 字符 都 将 被 当 作 一 个 符号 *， 表 示 一 段 
注释 的 开始 。 


根据 代码 中 注释 的 意思 ， 下 面 语句 的 本 意 似 乎 是 用 x 除 以 p 所 指向 的 值 ， 把 所 
得 的 商 再 赋 给 y: 


y = x/*p /* p 指 向 除数 */; 


而 实际 上 ， 必 被 编译 器 理解 为 一 段 注释 的 开始 ， 编 译 器 将 不 断 地 读 入 字符 ， 
直到 */ 出 现 为 止 。 也 就 是 说 ， 该 语句 直接 将 x 的 值 赋 给 y， 根 本 不 会 顾及 后 面 出 现 
的 p。 将 上 面 的 语句 重 写 如 下 : 


y=x/*p /* p 指 向 除数 */; 


或 者 更 加 清楚 一 点 ， 写 作 : 


y = x/(*p) /* p 指 向 除数 */; 


这 样 得 到 的 实际 效果 才 是 语句 注释 所 表示 的 原音 。 


诸如 此 类 的 准 二 义 性 Cnear-ambiguity) 问题 ， 在 有 的 上 下 文 环境 中 还 有 可 能 
招致 厂 烦 。 例 如 ， 老 版 本 的 C 语 言 中 允许 使 用 =+ 来 代表 现在 += 的 含义 。 这 种 老 版 
本 的 C 编 译 器 会 将 


a=-1; 
理解 为 下 面 的 语句 
a =- 1; 
亦 即 


因此 ， 如 果 程 序 员 的 原意 是 


a = -1; 


那么 所 得 结果 将 使 其 大 吃 一 慰 。 


男 外 ， 尺 管 儿 看 上 去 像 一 段 注 释 的 开始 ， 但 在 下 例 中 这 种 老 版 本 的 编译 器 会 


a =/ *b ; 


这 种 老 版 本 的 编译 器 还 会 将 复合 赋值 视 为 两 个 符号 ， 因 而 可 以 坚 无 疑问 地 处 


而 一 个 严格 的 ANSI C 编 译 器 则 会 报错 。 


14 整 型 常量 
如 果 一 个 整 型 常量 的 第 一 个 字符 是 数字 0， 那 么 该 常量 将 被 视 作 八进制 数 。 
因此 ，10 与 010 的 含义 截然 不 同 。 此 外 ， 许 多 C 编 译 器 会 把 8 和 9 也 作为 八进制 数字 
处 理 。 这 种 多 少 有 点 奇怪 的 处 理 方式 来 自 八进制 数 的 定义 。 例 如 ，0195 的 含义 是 
1x8“ 十 9x81I 十 5x80， 也 就 是 141 CHED 或 者 0215〈 八 进 制 ) 。 我 们 当然 不 建议 

这 种 用 法 ，ANSI C 标 准 也 禁止 这 种 用 法 。 


H 


需要 注意 以 下 这 种 情况 ， 有 时 候 在 上 下 文中 为 了 格式 对 齐 的 需要 ， 可 能 无 意 
中 将 十 进 制 数 写成 了 八进制 数 ， 例 如 : 


struct { 
int part_number; 
char *description; 


}parttab[] = { 


046, "left-handed widget" P 
047, "right-handed widget" 3 
125， "frammis" 


C 语 言 中 的 单 引 号 和 双 引 号 含义 迎 异 ， 在 茶 些 情况 下 如 果 把 两 者 弄 混 ， 编 译 
恬 并 不 会 检测 报错 ， 从 而 在 运行 时 产生 难以 预料 的 结果 。 


用 单 引 号 引起 的 一 个 字符 实际 上 代表 一 个 整数 ， 整 数值 对 应 于 该 字符 在 编译 
器 采用 的 字符 集中 的 序列 值 。 因 此 ， 对 于 采用 ASCII 字 符 集 的 编译 器 而 言 ，'a' 的 含 
X50141 JRD 或 者 97 十进制 ) 严格 一 致 。 


用 双 引 号 引起 的 字符 串 ， 代 表 的 却 是 一 个 指向 无 名 数组 起 始 字符 的 指针 ， 该 
数组 被 双 引 号 之 间 的 字符 以 及 一 个 额外 的 二 进 制 值 为 零 的 字符 \0' 初 始 化 。 


下 面 的 这 个 语句 : 


printf ("Hello world\n"); 


char hello[] = {'H', 'e', ‘l', 'l', 'o', ' ', 
' i 'o', "rly Ls 'd', '\n', ð}; 


w', 
printf (hello); 


因为 用 单 引 号 括 起 的 一 个 字符 代表 一 个 整数 ， 而 用 双 引 号 括 起 的 一 个 字符 代 
表 一 个 指针 ， 如 果 两 者 混用 ， 那 么 编译 器 的 类 型 检查 功能 将 会 检测 到 错误 。 例 
如 : 


char *slash = '/'; 


在 编译 时 将 会 生成 一 条 错误 消息 ， 因 为 /并 不 是 一 个 字符 指针 。 然 而 ， 茶 些 C 
编译 器 对 函数 参数 并 不 进行 类 型 检查 ， 特 别 是 printf 函 数 的 参数 。 因 此 ， 如 果 用 


printf('\n'); 
来 代替 正确 的 
printf("\n"); 


则 会 在 程序 运行 的 时 候 产 生 难 以 预料 的 错误 ， 而 不 会 给 出 编译 器 诊断 信息 。 
4.4 丰 还 详细 讨论 了 其 他 情形 。 


详 注 ; 


现在 的 编译 器 一 般 能 够 检测 到 在 函数 调用 时 混用 单 引 号 和 双 引 号 的 情形 。 


整 型 数 一 般 为 16 位 或 32 位 〉 的 存储 空间 可 以 容纳 多 个 字符 (一般 为 8 
位 ，， 因 此 有 的 C 编 译 器 允许 在 一 个 字符 常量 (以 及 字符 串 常量 ) 中 包括 多 个 字 
符 。 也 就 是 说 ， 用 'yes' 代 蔡 "yes" 不 会 被 该 编译 占 检 测 到 。 后 者 ( 即 "yes") 的 含义 
是 “依次 包含 yy、'e、's' 以 及 空 字 符 \0' 的 4 个 连续 内 存单 元 的 首 地 址 *"。 前 者 
《 即 yes') 的 含义 并 没有 准确 地 进行 定义 ， 但 大 多 数 C 编 译 器 理解 为 , “一 个 整数 
值 ， 由 yY'、'e'、'S 所 代表 的 整数 值 按照 特定 编译 器 实现 中 定义 的 方式 组 合 得 到 ”。 
因此 ， 这 两 者 如 果 在 数值 上 有 什么 相似 之 处 ， 也 完全 是 一 种 巧合 而 已 。 


详 注 ; 


在 Borland C++ v5.5 和 LCC v3.6 中 采取 的 做 法 是 ， 忽 略 多 余 的 字符 ， 最 后 的 整 
数值 即 第 一 个 字符 的 整数 值 ， 而 在 Visual C++ 6.0 和 GCC v2.95 中 采取 的 做 法 是 ， 
依次 用 后 一 个 字符 覆盖 前 一 个 字符 ， 最 后 得 到 的 整数 值 即 最 后 一 个 字符 的 整数 


值 。 


练习 1-1 某 些 C 编 译 器 允许 蔡 套 注释 。 请 写 一 个 测试 程序 ， 要 求 无 论 是 对 多 
许 嵌 套 注释 的 编译 器 ， 还 是 对 不 允许 符 套 注释 的 编译 器 ， 该 程序 都 能 正常 通过 编 
译 《〈《 无 错误 消息 出 现 ) ， 但 是 这 两 种 情况 下 程序 执行 的 结果 却 不 相同 。 


提示 : 


在 用 双 引 号 括 起 的 字符 串 中 ， 注 释 符 /* 属于 字符 串 的 一 部 分 ， 而 在 注释 中 出 
现 的 双 引 号 " "又 属于 注释 的 一 部 分 。 


练习 1-2 ”如 果 由 你 来 实现 一 个 C 编 译 器 ， 你 是 否 会 允许 髓 套 注 释 ? 如 果 你 使 
用 的 C 编 译 器 允许 租 套 注释 ， 你 会 用 到 编译 器 的 这 一 特性 吗 ? 你 对 第 二 个 问题 的 


回答 是 否 会 影响 到 你 对 第 一 个 问题 的 回答 ? 
练习 1-3 ”为 什么 n-->0 的 含义 是 n-- > 0， 而 不 是 n- -> 0? 


练习 1-4 ”at+++++b 的 含义 是 什么 ? 


第 2 草 ” 语 法“ 陷阱? 


要 理解 一 个 C 程 序 ， 仅 仅 理 解 组 成 该 程序 的 符号 是 不 够 的 。 程 序 员 还 必须 理 
解 这 些 符号 是 如 何 组 合成 声明 、 表 达 式 、 语 句 和 程序 的 。 虽 然 这 些 组 合 方式 的 定 
义 都 很 完备 ， 几 乎 无 懈 可 击 ， 但 有 时 这 些 定义 与 人 们 的 直 沉 相悖 ， 或 者 容易 引起 
混淆 。 本 章 将 讨论 一 些 用 法 和 意义 与 我 们 想当然 的 认识 不 一 致 的 语法 结构 。 


2.1 理解 函数 声明 


有 一 次 ， 一 位 程序 员 与 我 交谈 一 个 问题 。 他 当时 正在 编写 一 个 独立 运行 于 某 
种 微 处 理 器 上 的 C 程 序 。 当 计算 机 局 动 时 ， 硬 件 将 调用 首 地 址 为 0 位 置 的 子 例 程 。 


为 了 模拟 开机 启动 时 的 情形 ， 我 们 必须 设计 出 一 个 C 语 句 ， 以 显 式 调用 该 子 
例 程 。 经 过 一 段 时 间 的 思考 ， 我 们 最 后 得 到 的 语句 如 下 : 


(*(void(*)())@)()3 


IRE IY Ze TE AS & BES CREE RARR”. ME, AMT ACH AN 
对 此 望 而 生 綦 ， 因 为 构造 这 类 表达 式 其 实 只 有 一 条 简单 的 规则 ;按照 使 用 的 方式 
来 声明 。 


任何 C 变 量 的 声明 都 由 两 部 分 组 成 : 类 型 以 及 一 组 类 似 表 达 式 的 声明 符 
(declarator) 。 声 明 符 从 表面 上 看 与 表达 式 有 些 类 似 ， 对 它 求 值 应 该 返回 一 个 声 
明 中 给 定 类 型 的 结果 。 最 简单 的 声明 符 就 是 单个 变量 ， 如 : 


float f, g; 


这 个 声明 的 含义 是 : 当 对 其 求 值 时 ， 表 达 式 f 和 g 的 类 型 为 浮 点 数 类 型 
(float) 。 因 为 声明 符 与 表达 式 相 似 ， 所 以 我 们 也 可 以 在 声明 符 中 任意 使 用 括 


i= 


TTR 


float ((f)); 


这 个 声明 的 含义 是 : 当 对 其 求 值 时 ，((D) 的 类 型 为 浮 点 类 型 ， 由 此 可 以 推 
知 ，f 也 是 浮 点 类 型 。 


同样 的 逻辑 也 适用 于 函数 和 指针 类 型 的 声明 ， 例 如 : 


float ff(); 


这 个 声明 的 含义 是 : 表达 式 ff() 的 求 值 结果 是 一 个 浮 点 数 ， 也 就 是 说 ，ff 是 一 
个 返回 值 为 浮 点 类 型 的 函数 。 类 似 地 ， 
float *pf; 


这 个 声明 的 含义 是 : *pf 是 一 个 浮 点 数 ， 也 就 是 说 ，pf 是 一 个 指向 浮 点 数 的 指 
针 。 


以 上 这 些 形式 在 声明 中 还 可 以 组 合 起 来 ， 就 像 在 表达 式 中 进行 组 合 一 样 。 因 
此 ， 


表示 *g() 与 (*h)0 是 浮 点 表达 式 。 因 为 0 结合 优先 级 高 于 ，*g() 也 就 是 *(g()): 
g 是 一 个 函数 ， 该 函数 的 返回 值 类 型 为 指 癌 浮 点 数 的 指针 。 同 理 ， 可 以 得 出 h 是 一 
个 函数 指针 ，h 所 指 问 函数 的 返回 值 为 浮 点 类 型 。 


一 旦 我 们 知道 了 如 何 声明 一 个 给 定 类 型 的 变量 ， 那 么 该 类 型 的 类 型 转换 符 就 
很 容易 得 到 了 : 只 需要 把 声明 中 的 变量 名 和 声明 末尾 的 分 号 去 掉 ， 再 将 剩余 的 部 
分 用 一 个 括号 整个 “封装 ”起 来 即 可 。 例 如 ， 因 为 下 面 的 声明 : 


float (*h)(); 


表示 h 是 一 个 指向 返回 值 为 浮 点 类 型 的 函数 的 指针 ， 因 此 ， 


(float (*)()) 


表示 一 个 “指向 返回 值 为 浮 点 类 型 的 函数 的 指针 ”的 类 型 转换 符 。 


有 了 这 些 预 备 知识 ， 我 们 现在 可 以 分 两 步 来 分 析 表 达 式 (*(void(*)0)0)0。 


第 一 步 ， 假 定 变 量 fp 是 一 个 函数 指针 ， 那 么 如 何 调用 印 所 指向 的 函数 呢 ? 调 
用 方法 如 下 : 


| (*fp) (); 


因为 外 是 一 个 函数 指针 ， 那 么 *fp 就 是 该 指针 所 指向 的 函数 ， 所 以 (C*fp)0 就 是 
调用 该 函数 的 方式 。ANSI C 标 准 允许 程序 员 将 上 式 简写 为 fp 中 ， 但 是 一 定 要 记 住 
这 种 写法 只 是 一 种 简写 形式 。 


在 表达 式 (*fp)() 中 ，*fp 两 侧 的 括号 非常 重要 ， 因 为 函数 运算 符 () 的 优先 级 高 
于 单 目 运算 符 *。 如 果 *fp 两 侧 没有 括号 ， 那 么 *fp0 实 际 上 与 *(fpO) 的 含义 完全 一 
致 ，ANSI C 把 它 作 为 *((*fp)O) 的 简写 形式 。 


现在 ， 剩 下 的 问题 就 只 是 找到 一 个 恰当 的 表达 式 来 蔡 换 印 。 我 们 将 在 分 析 的 
第 二 步 来 解决 这 个 问题 。 如 果 C 编 译 器 能 够 理解 我 们 大 脑 中 对 于 类 型 的 认识 ， 那 
么 我 们 可 以 这 样 写 : 
(*0)(); 

上 式 并 不 能 生效 ， 因 为 运算 符 * 必 须 用 一 个 指针 来 作为 操作 数 。 不 仅 如 此 ， 
这 个 指针 还 应 该 是 一 个 函数 指针 ， 这 样 经 运算 符 * 作 用 后 的 结果 才能 作为 函数 被 
调用 。 因 此 ， 在 上 式 中 必须 对 0 作 类 型 转换 ， 转 换 后 的 类 型 可 以 大 致 描述 为 “指向 
返回 值 为 void 类 型 的 函数 的 指针 ?”。 


如 果 印 是 一 个 指 回 返 回 值 为 void 类 型 的 函数 的 指针 ， 那 么 (*fp)O 的 值 为 void， 
fp 的 声明 如 下 : 


void (*fp)(); 


因此 ， 我 们 可 以 用 下 式 来 调用 存储 位 置 为 0 的 子 例 程 : 


void (*fp)(); 
(*fp)(); 


PEE: 


此 处 作者 假设 全 默认 初始 化 为 0%， 这 种 写法 不 宜 提倡 。 


这 种 写法 的 代价 是 多 声明 了 一 个 “ 哑 ? 变 量 。 


我 们 一 旦 知道 如 何 声明 一 个 变量 ， 自 然 也 就 知道 如 何 对 一 个 第 数 进行 类 型 转 
换 ， 将 其 转型 为 该 变量 的 类 型 : 只 需要 在 变量 声明 中 将 变量 名 去 邱 即 可 。 因 此 ， 
将 常数 0 转型 为 “指向 返回 值 为 void 的 函数 的 指针 ”类 型 ， 可 以 这 样 写 : 


(void (*)())e 


因此 ， 我 们 可 以 用 (void (*)0)0 来 蔡 换 全 ， 从 而 得 到 : 


(*(void (*)())0)(); 


末尾 的 分 号 使 得 表达 式 成 为 一 个 语句 。 


在 我 当初 解决 这 个 问题 的 时 候 ，C 语 言 中 还 没有 typedef 声 明 。 尽 管 不 用 
typedef 来 解决 这 个 问题 对 削 析 本 例 的 细节 而 言 是 一 种 很 好 的 方式 ， 但 无 疑 使 用 
typedef 能 够 使 表述 更 加 清晰 : 


这 个 环 手 的 例子 并 不 是 孤立 的 ， 还 有 一 些 C 程 序 员 经 常 遇 到 的 问题 ， 实 际 上 
和 这 个 例子 是 同一 个 类 型 的 。 例 如 ， 考 虑 signal 库 函数 ， 在 包括 该 函数 的 C 编 译 器 
实现 中 ，signal 函 数 接受 两 个 参数 : 一 个 是 代表 需要 “被 捕获 ”的 特定 signal 的 整数 
值 ， 另 一 个 是 指向 用 户 提供 的 函数 的 指针 。 该 函数 用 于 处 理 “ 捕 获 到 ”的 特定 
signal， 返 回 值 类 型 为 void。 我 们 将 会 在 5.5 节 详细 讨论 该 函数 。 


一 般 情况 下 ， 程 序 员 并 不 主动 声明 signal 函 数 ， 而 是 直接 使 用 系统 头 文件 
signal.h 中 的 声明 。 那 么 ， 在 头 文件 signalh 中 ，signal 函 数 是 如 何 声明 的 呢 ? 


首先 ， 让 我 们 从 用 户 定义 的 信号 处 理 函 数 开始 考虑 ， 这 无 疑 是 最 容易 解决 
的 。 该 函数 可 以 定义 如 下 : 


void sigfunc(int n){ 


/* 特定 信号 处 理 部 分 */ 


} 


函数 sigfunc 的 参数 是 一 个 代表 特定 信号 的 整数 值 ， 此 处 我 们 暂时 忽略 它 。 


上 面 假 设 的 函数 体 定 义 了 sigfunc 函 数 ， 因 而 sigfunc 函 数 的 声明 可 以 如 下 : 


void sigfunc(int ); 

现在 假定 我 们 希望 声明 一 个 指向 sigfunc 函 数 的 指针 变量 ， 不 妨 命名 为 sfp。 
为 sfp 指 向 sigfunc 函 数 ， 则 *sfp 就 代表 了 sigfunc 函 数 ， 所 以 *sfp 可 以 被 调用 。 又 假 
定 sig 是 一 个 整数 ， 则 (*sfp)(sig) 的 值 为 void 类 型 ， 因 此 我 们 可 以 如 下 声明 sfp: 


void (*sfp)(int); 


上 和 式 显 示 了 如 何 声明 signal 函 数 。 因 为 signal 函 数 的 返回 值 类 型 与 sfp 的 返回 类 
型 一 样 ， 我 们 可 以 如 下 声明 signal 函 数 : 


void (*signal(something))(int); 


此 处 的 something 代 表 了 signal 函 数 的 参数 类 型 ， 我 们 还 需要 进一步 了 解 如 何 
声明 它们 。 上 面 声明 可 以 这 样 理 解 : 传递 适当 的 参数 以 调用 signal 函 数 ， 对 signal 
函数 返回 值 〈 为 函数 指针 类 型 ) 解除 引用 〈dereference) ， 然 后 传递 一 个 整 型 参 
数 调用 解除 引用 后 所 得 函数 ， 最 后 返回 值 为 void 类 型 。 因 此 ，signal 函 数 的 返回 值 
是 一 个 指向 返回 值 为 void 类 型 的 函数 的 指针 。 


那么 ，signal 函 数 的 参数 又 是 如 何 呢 ? signal 函 数 接受 两 个 参数 : 一 个 整 型 的 


信号 编写， 以 及 一 个 指向 用 户 定义 的 信号 处 理 函数 的 指针 。 我 们 此 前 已 经 定义 了 
指向 用 户 定义 的 信号 处 理 函 数 的 指针 sfp: 


sfp 的 类 型 可 以 通过 将 上 面 声明 中 的 sfp 去 掉 而 得 到 ， 即 void (*)(Gint)。 此 外 ， 
signal 函 数 的 返回 值 是 一 个 指向 调用 前 的 用 户 定 义 信号 处 理 函 数 的 指针 ， 这 个 指针 
的 类 型 与 sp 指针 类 型 一 致 。 因 此 ， 我 们 可 以 如 下 声明 signal 函 数 : 


void (*signal(int, void(*)(int)))(int); 


同样 地 ， 使 用 typedef 可 以 简化 上 面 的 函数 声明 : 


typedef void (*HANDLER) (int); 
HANDLER signal(int, HANDLER); 


2.2 运算 符 的 优先 级 问题 


假设 存在 一 个 已 定义 的 常量 FLAG， 它 是 一 个 整数 ， 且 该 整数 值 的 二 进 制 表 
示 中 只 有 某 一 位 是 1， 其 余 各 位 均 为 0， 亦 即 该 整数 是 2 的 菜 次 梭 。 如 果 对 于 整 型 
变量 flags， 我 们 需要 判断 它 在 常量 FLAG 为 1 的 那 一 位 上 是 否 同样 也 为 1， 通 常 可 
以 这 样 写 : 
if (flags & FLAG) .. 

上 式 的 含义 对 大 多 数 C 程 序 员 来 说 是 显而易见 的 : 让 语句 判断 括号 内 表达 式 的 
值 是 否 为 0。 考 虑 到 可 读 性 ， 如 果 对 表达 式 的 值 是 否 为 0 的 判断 能 够 显 式 地 加 以 说 
明 ， 无 疑 使 得 代码 自身 就 起 到 了 注释 该 段 代 码 意图 的 作用 ， 其 写法 如 下 : 


if (flags & FLAG != @) .. 

这 个 语句 现在 虽然 更 好 懂 了， 但 却 是 一 个 错误 的 语句 。 因 为 != 运 算 符 的 优先 
级 要 高 于 & 运 算 符 ， 所 以 上 式 实 际 上 被 解释 为 : 
if (flags & (FLAG != @) ) .… 


因此 ， 除 了 FLAG 恰 好 为 1 的 情形 ，FLAG 为 其 他 数 时 这 个 表达 式 都 是 错误 
的 。 


又 假设 hi 和 low 是 两 个 整数 ， 它 们 的 值 介 于 0 和 15 之 间 ， 如 果 r 是 一 个 8 位 整 
数 ， 且 r 的 低 4 位 与 jow 各 位 上 的 数 一 致 ， 而 r 的 高 4 位 与 hi 各 位 上 的 数 一 致 ， 很 自然 
会 想到 要 这 样 写 : 


[r= hiesa + tows o 
但 是 很 不 幸 ， 这 样 写 是 错误 的 。 加 法 运算 的 优先 级 要 比 移 位 运算 的 优先 级 
高 ， 因 此 本 例 实际 上 相当 于 ; 


r = hi<< (4 + low); 


对 于 这 种 情况 ， 有 两 种 更 正方 法 : 第 一 种 方法 是 加 括号 ;第 二 种 方法 意识 到 


问题 出 在 程序 员 混 消 了 算术 运算 与 逻辑 运算 ， 于 是 将 原来 的 加 号 改 为 按 位 逻辑 
或 ， 但 这 种 方法 震 涉 到 的 移 位 运算 与 逻辑 运算 的 相对 优先 级 就 更 加 不 是 那么 明 
显 。 两 种 方法 如 下 : 


r= (hi<<4) + low; // 法 1: 加 括号 
r = hi<<4 | low; // 法 2: 将 原来 的 加 号 改 为 按 位 逻辑 或 


用 添加 括号 的 方法 虽然 可 以 完全 避免 这 类 问题 ， 但 是 表达 式 中 有 了 太 多 的 括 
号 反而 不 容易 理解 。 因 此 ， 记 住 C 语 言 中 运算 符 的 优先 级 是 有 益 的 。 


遗憾 的 是 ， 运 算 符 优先 级 有 15 个 之 多 ， 因 此 记 住 它们 并 不 是 一 件 容易 的 事 。 
完整 的 C 语 言 运算 符 优先 级 表 如 表 2-1 所 示 。 


表 2-1 C 语 言 运算 符 优先 级 表 (由 上 至 下 ， 优 先 级 依次 递减 ) 


运算 符 结合 性 
OU->. 自 左 向 右 
| ~ ++ -- - (type) * & sizeof 自 右 向 左 
*/% 自 左 向 右 
于 自 左 向 右 
<< >> 自 左 向 右 
< <=> >= 自 左 向 右 


== = 自 左 向 右 
& 自 左 向 右 
A 自 左 向 右 

自 左 向 右 
&& 自 左 向 右 
| 自 左 向 右 
? 自 右 向 左 
assignments 自 右 向 左 

自 左 向 右 


如 果 把 这 些 运算 符 恰 当 分 组 ， 并 且 理 解 了 各 组 运算 符 之 间 的 相对 优先 级 ， 那 
么 这 张 表 其 实 不 难 记 住 。 


优先 级 最 高 者 其 实 并 不 是 真正 意义 上 的 运算 符 ， 包 括 数组 下 标 、 函 数 调用 操 
作 符 各 结构 成 员 选 择 操 作 符 。 它 们 都 是 自 左 向 右 结合 ， 因 此 a.b.c 的 含义 是 (a.b).c， 
而 不 是 a.(b.c)。 


单 目 运算 符 的 优先 级 仅 次 于 前 述 运算 符 。 在 所 有 真正 意义 上 的 运算 符 中 ， 它 
们 的 优先 级 最 高 。 因 为 函数 调用 的 优先 级 要 高 于 单 目 运算 符 的 优先 级 ， 所 以 如 果 
p 是 一 个 函数 指针 ， 要 调用 p 所 指向 的 函数 ， 必 须 这 样 写 ，(*p)0)。 如 果 写 成 *p0， 
编译 器 会 解释 成 *(p())。 类 型 转换 也 是 单 目 运算 符 ， 它 的 优先 级 和 其 他 单 目 运 算 符 


的 优先 级 一 样 。 单 目 运算 符 是 自 右 向 左 结合 ， 因 此 部 ++ 会 被 编译 器 解释 成 * 
(p++)， 即 取 指 针 p 所 指向 的 对 象 ， 然 后 将 p 递 增 1;， 而 不 是 (*p)++， 即 取 指 针 p 所 指 
各 的 对 象 ， 然 后 将 该 对 象 递增 1。3.7 节 还 进一步 指出 pt+ 的 含义 有 时 会 出 人 意料 。 


优先 级 比 单 目 运 算 符 要 低 的 ， 接 下 来 就 是 双 目 运算 符 。 在 双 目 运算 符 中 ， 算 
术 运 算 符 的 优先 级 最 高 ， 移 位 运算 符 次 之 ， 关 系 运算 符 再 次 之 ， 接 着 是 逻辑 运算 
符 、 赋 值 运算 符 ， 最 后 是 条 件 运 算 符 。 


Hir: 


原 书 如 此 ， 条 件 运算 符 实 际 应 为 三 目 运算 符 。 


我 们 需要 记 住 的 最 重要 的 两 点 是 : 


1. 任何 一 个 逻辑 运算 符 的 优先 级 低 于 任何 一 个 关系 运算 符 ; 


2. 移 位 运算 符 的 优先 级 比 算术 运算 符 要 低 ， 但 是 比 关 系 运 算 符 要 高 。 


属于 同一 类 型 的 各 个 运算 符 之 间 的 相对 优先 级 ， 理 解 起 来 一 般 没 有 什么 困 
难 。 乘 法 、 除 法 和 求 余 优先 级 相同 ， 加 法 、 减 法 的 优先 级 相同 ， 两 个 移 位 运算 符 
的 优先 级 也 相同 。1/2*a 的 含义 是 (1/2)*a， 而 不 是 1/((2*a)， 这 一 点 也 许 会 让 某 些 人 
吃惊 ， 其 实在 这 方面 C 语 言 与 Fortran 语 言 、Pascal 语 言 以 及 其 他 程序 设计 语言 之 间 
的 行为 表现 并 无 差别 。 


但 是 ，6 个 关系 运算 符 的 优先 级 并 不 相同 ， 这 一 点 或 许 让 人 感到 有 些 吃 慰 。 
运算 符 == 和 != 的 优先 级 要 低 于 其 他 关系 运算 符 的 优先 级 。 因 此 ， 如 果 我 们 要 比较 
a 与 b 的 相对 大 小 顺序 是 否 和 c 与 d 的 相对 大 小 顺序 一 样 ， 就 可 以 这 样 与 : 


任何 两 个 逻辑 运算 符 都 具有 不 同 的 优先 级 。 所 有 的 按 位 运算 符 优 先 级 要 比 顺 
序 运算 符 的 优先 级 高 ， 每 个 “与 ?运算 符 要 比 相 应 的 “或 "运算 符 优 先 级 高 ， 而 按 位 
异 或 运算 符 〈^ 运 算 符 ) 的 优先 级 介 于 按 位 与 运算 符 和 按 位 或 运算 符 之 间 。 


这 些 运 算 符 的 优先 顺序 是 由 于 历史 原因 形成 的 。B 语 言 是 C 语 言 的 “祖先 ”，B 
语言 中 的 逻辑 运算 符 大 致 相当 于 C 语 言 中 的 & 和 | 运算 符 。 虽 然 这 些 运算 符 从 定义 
上 而 言 是 按 位 操作 的 ， 但 是 当 它 们 出 现在 条 件 语句 的 上 下 文中 时 ，B 语 言 的 编译 
器 会 将 它们 作为 相当 于 现在 C 语 言 中 的 && 和 || 运算 符 来 处 理 。 而 到 了 C 语 言 中 ， 
这 两 种 不 同 的 用 法 被 区 分 开 来 ， 从 兼容 性 的 角度 来 考虑 ， 如 果 对 它们 优先 顺序 的 
改变 过 大 ， 将 是 一 件 危险 的 事 。 


在 本 节 到 现在 为 止 提 及 的 所 有 运算 符 中 ， 三 目 条 件 运 算 符 的 优先 级 最 低 。 这 
就 允许 我 们 在 三 目 条 件 运算 符 的 条 件 表 达 式 中 包括 关系 运算 符 的 逻辑 组 合 ， 例 
如 : 


tax_rate = income>46666 && residency<5 ? 3.5: 2.0; 

本 例 其 实 还 说 明了 赋值 运算 符 的 优先 级 低 于 条 件 运算 符 的 优先 级 是 有 意义 
的 。 此 外 ， 所 有 赋值 运算 符 的 优先 级 是 一 样 的 ， 而 且 它 们 的 结合 方式 是 自 右 问 
左 ， 因 此 ， 


home_score = visitor score = ð; 


与 下 面 两 条 语句 所 表达 的 意思 是 相同 的 : 


visitor score = ð; 
home_score = visitor_score; 


在 所 有 的 运算 符 中 ， 运 号 运算 符 的 优先 级 最 低 。 这 一 点 很 容易 记 住 ， 因 为 在 
需要 一 个 表达 式 而 不 是 一 条 语句 时 ， 经 常 使 用 逗号 运算 符 来 丛 换 作为 语句 结束 标 


志 的 分 号。 去 号 运算 符 在 宏 定义 中 特别 有 用 ， 这 一 点 在 6.3 节 还 会 进一步 讨论 。 


在 涉及 赋值 运算 符 时 ， 经 向 会 引起 优先 级 的 混 请 。 考 虑 下 面 这 个 例子 ， 例 子 
中 循环 语句 的 本 意 是 复制 一 个 文件 到 另 一 个 文件 : 


while (c=getc(in) != EOF) 
putc(c, out); 


在 while 语 句 的 表达 式 中 ，c 似 乎 是 首先 被 赋予 函数 getc(in) 的 返回 值 ， 然 后 与 
EOF 比 较 是 否 到 达 文 件 结尾 以 便 决 定 是 否 终止 循环 。 然 而 ， 由 于 赋值 运算 符 的 优 
先 级 要 低 于 任何 一 个 比较 运算 符 ， 因 此 c 的 值 实际 上 是 函数 getc(in) 的 返回 值 与 EFOF 
比较 的 结果 。 此 处 函数 getc(in) 的 返回 值 只 是 一 个 临时 变量 ， 在 与 EOF 比 较 后 就 
被 “丢弃 ”了 。 因 此 ， 最 后 得 到 的 文件 “副本 ”中 只 包括 了 一 组 二 进 制 值 为 1 的 字 市 
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上 例 实际 应 该 写成 : 


while ((c=getc(in)) != EOF) 
putc(c,out) ; 


如 果 表 达 式 再 复杂 一 点 ， 这 类 错误 就 很 难 被 察觉 。 例 如 ， 第 4 章 章 首 提 及 的 
lint 程 序 的 一 个 版 本 ， 在 发 布 时 包括 了 下 面 一 行 错误 代码 : 


if( (t=BTYPE(pt1->aty)==STRTY) || t==UNIONTY){ 


这 行 代码 本 意 是 首先 赋值 给 t， 然 后 判断 t 是 否 等 于 STRTY 或 者 UNIONTY 。 实 
际 的 结果 却 大 相 径 庭 : 根据 BTYPE(pt1->aty) 的 值 是 否 等 于 STRTY，t 的 取 值 或 者 
为 1 或 者 为 0;， 如果 t 取 值 为 0， 还 将 进一步 与 UNIONTY 比 较 。 


2.3 注意 作为 语句 结束 标志 的 分 号 

在 C 程 序 中 ， 如 果 不 小 心 多 写 了 一 个 分 号 ， 可 能 不 会 造成 什么 不 民 后 果 : 这 
个 分 号 也 许 会 被 视 作 一 个 不 会 产生 任何 实际 效果 的 空 语 句 ， 或 者 编译 器 会 因为 这 
个 多 余 的 分 号 而 产生 一 条 警告 信息 ， 根 据 警 告 信息 的 提示 能 够 很 容易 去 挥 这 个 分 
号 。 一 种 重要 的 例外 情形 是 在 if 或 者 while 语 句 之 后 需要 紧 跟 一 条 语句 时 ， 如 果 此 
时 多 了 一 个 分 号 ， 那 么 原来 基 跟 在 if 或 者 while 子 句 之 后 的 语句 就 是 一 条 单独 的 语 
句 ， 与 条 件 判断 部 分 没有 了 任何 关系 。 考 虑 下 面 的 这 个 例子 : 


if (x[i] > big); 
big = x[i]; 


编译 器 会 正常 地 接受 第 一 行 代码 中 的 分 号 而 不 会 提示 任何 警告 信息 ， 因 此 编 
译 占 对 这 段 程 序 代码 的 处 理 与 对 下 面 这 段 代 码 的 处 理 束 大 不 相同 : 


if (x[i] > big) 

big = x[i]; 

前 面 第 一 个 例子 ( 即 在 站 后 多 加 了 一 个 分 号 的 例子 ) 实际 上 相当 于 
if (x[i] > big) { } 

big = x[i]; 


当然 ， 也 就 等 同 于 〈 除 非 x、i 或 者 big 是 有 副作用 的 宏 ) 


big = x[i]; 


如 果 不 是 多 写 了 一 个 分 号 ， 而 是 遗漏 了 一 个 分 写 ， 同 样 会 招致 麻烦 ， 例 如 : 


if (n<3) 


return 
logrec.date = 
logrec.time = 
logrec.code = x[2]; 


此 处 的 retum 语 句 后 面 遗 漏 了 一 个 分 号 ， 然 而 这 段 程序 代码 仍然 会 顺利 通过 编 


译 而 不 会 报错 ， 只 是 将 语句 


logrec.date = x[@]; 


当 作 了 returmn 语 句 的 操作 数 。 上 面 这 段 程序 代码 实际 上 相当 于 : 


if (n<3) 

return logrec.date = x[@]; 
logrec.time = x[1]; 
logrec.code = x[2]; 


如 果 这 段 代码 所 在 的 函数 声明 其 返回 值 为 void， 编 译 器 会 因为 实际 返回 值 的 
类 型 与 声明 返回 值 的 类 型 不 一 致 而 报错 。 然 而 ， 如 果 一 个 函数 不 需要 返回 值 〈 即 
返回 值 为 void) ， 我 们 通常 会 在 函数 声明 时 省 略 返 回 值 类 型 ， 但 是 此 时 对 编译 露 
而 言 会 隐 含 地 将 函数 返回 值 类 型 视 作 int 类 型 。 如 果 是 这 样 ， 上 面 的 错误 就 不 会 被 
编译 器 检测 到 。 在 上 面 的 例子 中 ， 当 n>=3 时 ， 第 一 个 赋值 语句 会 被 直接 跳 过 ， 由 
此 造成 的 错误 可 能 会 是 一 个 潜伏 很 深 、 极 难 发 现 的 程序 Bug。 


当 一 个 声明 的 结尾 紧 跟 一 个 函数 定义 时 ， 有 分 号 与 没 分 号 的 实际 效果 相差 极 
为 不 同 。 如 果 声 明 结 尾 的 分 号 被 省 略 ， 编 译 器 可 能 会 把 声明 的 类 型 视 作 函数 的 返 
回 值 类 型 。 考 虑 下 面 的 例子 : 


struct logrec{ 


int date; 
int time; 
int code; 

} 

main() 

} 


在 第 一 个 } 与 紧 随 其 后 的 函数 main 定 义 之 间 ， 遗 漏 了 一 个 分 号 。 因 此 ， 上 面 
代码 段 的 实际 效果 是 声明 函数 main 的 返回 值 是 struct logrec 类 型 。 写 成 下 面 这 样 ， 


会 看 得 更 清楚 : 


struct logrec{ 


int date; 
int time; 
int code; 

} 

main() 

{ 


如 果 分 号 没有 被 省 略 ， 函 数 main 的 返回 值 类 型 会 缺 省 定义 为 int 类 型 。 


在 函数 main 中 ， 如 果 本 应 返回 一 个 int 类 型 数值 ， 却 声明 返回 一 个 struct logrec 
类 型 的 结构 ， 会 产生 怎样 的 效果 呢 ? 我 们 把 它 留 作 本 章 结 尾 的 一 个 练习 。 虽 然 刻 
意 地 往 消极 面 去 联想 也 许 有 些 “ 病 态 ”， 但 对 于 要 考虑 到 各 种 意外 情形 的 程序 设计 
来 说 (比如 航空 航天 或 医疗 仪器 的 控制 程序 ) ， 却 是 不 无 神 益 的 。 


2.4 switch 语句 


C 语 言 的 Switch 语句 的 控制 流程 能 够 依次 通过 并 执行 各 个 case 部 分 ， 这 一 点 是 
C 语 言 的 与 众 不 同 之 处 。 考 虑 下 面 的 例子 ， 两 段 程序 代码 分 别 用 C 语 言 和 Pascal 语 
言 编写 : 


switch(color){ 

case 1: printf(“red”); 
break; 

case 2: printf(“yellow”); 
break; 

case 3: printf(“blue”) ; 
break; 


case color of 

1: write(‘red’); 

2: write( ‘yellow’ ); 
3: write( ‘blue’ ); 


两 段 程 序 代码 要 完成 的 是 同样 的 任务 : 根据 变量 color 的 值 (1. 283) ， 分 
别 打 印 出 red、yellow 或 blue。 两 段 程序 代码 非常 相似 ， 只 有 一 种 例外 情形 : 那 就 
是 用 Pascal 语 言 编写 的 程序 段 中 每 个 case 部 分 并 没有 与 C 语 言 的 break 语 句 对 应 的 部 
分 。 之 所 以 会 这 样 ， 是 因为 C 语 言 中 把 case 标 号 当 作 真 正 意 义 上 的 标号 ， 因 此 程序 
的 控制 流程 会 径直 通过 case 标 号 ， 而 不 会 受到 任何 影响 。 而 在 Pascal 语 言 中 ， 每 个 


case 标 号 都 隐 含 地 结束 了 前 一 个 case 部 分 。 


证 我 们 从 另 一 个 角度 来 看 竺 这 个 问题 ， 假 设 对 前 面 用 C 语 言 编写 的 程序 代码 
段 稍 作 改 动 ， 使 其 在 形式 上 与 用 Pascal 语 言 编写 的 代码 段 类 似 : 


switch (color) { 

case 1:printf(“red”) ; 
case 2:printf(“yellow”) ; 
case 3:printf(“blue”) ; 


} 


又 进一步 假定 变量 color 的 值 为 >。 最后， 程序 将 会 打印 出 


yellowblue 


因为 程序 的 控制 流程 在 执行 了 第 二 个 printf 函 数 的 调用 之 后 ， 会 自然 而 然 地 顺 
序 执行 下 去 ， 所 以 第 三 个 printf 函 数 调用 也 会 被 执行 。 


C 语 言 中 switch 语 名 的 这 种 特性 ， 既 是 它 的 优势 所 在 ， 也 是 它 的 一 大 弱点 。 说 
它 是 一 大 弱点 ， 是 因为 程序 员 很 容易 遗漏 各 个 case 部 分 的 break 语 句 ， 造 成 一 些 难 
以 理解 的 程序 行为 。 说 它 是 优势 所 在 ， 是 因为 如 果 程 序 员 有 意 略 去 一 个 break 语 
句 ， 则 可 以 表达 出 一 些 采 用 其 他 方式 很 难 方便 地 加 以 实现 的 程序 控制 结构 。 特 别 
是 对 于 一 些 大 的 switch 语 句 ， 我 们 常 沼 会 发 现 各 个 分 文 的 处 理 大 同 小 异 : 对 某 个 
分 文 情况 的 处 理 只 要 稍 作 改动 ， 剩 余部 分 就 完全 等 同 于 另 一 个 分 文 情 况 下 的 处 
理 。 


例如 ， 考 虑 这 样 一 个 程序 ， 它 是 茶 种 假想 的 计算 机 的 解释 器 〈 相 当 于 虚拟 
HO 。 这 个 程序 中 有 一 个 switch 语 句 ， 用 来 处 理 每 个 不 同 的 操作 码 。 在 这 种 假想 
的 计算 机 上 ， 只 要 将 第 二 个 操作 数 的 正 负 号 反 号 后 ， 减 法 运算 和 加 法 运算 的 处 理 
本 质 上 就 是 一 样 的 。 因 此 ， 如 果 我 们 可 以 像 下 面 这 样 写 代码 ， 无 疑 会 大 大 方便 程 
序 的 处 理 : 


Case SUBTRACT : 


opnd2 = -opnd2; 
/* 此 处 没有 break 语 句 */ 
case ADD: 


当然 ， 像 上 面 的 例子 那样 添加 适当 的 程序 注释 是 一 种 不 错 的 做 法 。 如 果 其 他 
人 阅读 到 这 段 代码 ， 就 能 够 了 解 到 此 处 是 有 意 省 去 了 一 个 break 语 句 。 


再 看 另 一 个 例子 。 考 虑 这 样 一 段 代码 ， 它 的 作用 是 一 个 编译 器 在 查找 符号 时 
跳 过 程序 中 的 空白 字符 。 这 里 ， 空 格 键 、 制 表 符 和 换行 符 的 处 理 都 是 相同 的 ， 不 
过 在 遇 到 换行 符 时 ， 程 序 的 代码 行 计数 器 需要 进行 递增 ; 


case ‘\n’: 


linecount++; 

/* 此 处 没有 break 语 句 */ 
case ‘\t’: 
case € <: 


2.5 KAŽ 


与 其 他 程序 设计 语言 不 同 ，C 语 言 要 求 : 在 函数 调用 时 ， 即 使 函数 不 带 参 
数 ， 也 应 该 包括 参数 列表 。 因 此 ， 如 果 { 是 一 个 函数 ， 那 么 


f() 


是 一 个 函数 调用 语句 ， 而 
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却 是 一 个 什么 也 不 做 的 语句 。 更 精确 地 说 ， 这 个 语句 计算 函数 f 的 地 址 ， 却 并 
不 调用 该 函数 。 


2.6 “悬挂 ”else 引 发 的 问题 


这 个 问题 虽然 已 经 为 人 熟知 ， 而 且 也 并 非 C 语 言 所 独 有 ， 但 即使 是 有 多 年 经 
验 的 C 程 序 员 ， 也 常常 在 此 出 现 失误 。 


考虑 下 面 的 程序 片段 : 


if (x == @) 

if (y == @) error(); 
else{ 

z=xty 

f(&z ) 
} 


在 这 段 代 码 中 ， 编 程 人 员 的 本 意 是 应 该 有 两 种 主要 情况 : x 等 于 0 以 及 x 不 等 
于 0。 对 于 x 等 于 0 的 情形 ， 除 非 y 也 等 于 0《〈 此 时 调用 函数 error ) ， 人 否则 程序 不 作 
任何 处 理 ， 对 于 x 不 等 于 0 的 情形 ， 程 序 首 先 将 x 与 y 之 和 赋值 给 z， 然 后 以 z 的 地 址 
为 参数 来 调用 函数 f。 


然而 ， 这 段 代 码 实际 上 所 做 的 却 与 编程 者 的 意图 相去 其 远 。 原 因 在 于 C 语 言 
中 有 这 样 的 规则 ， 即 else 始 终 与 同一 对 括号 内 最 近 的 未 匹配 的 ii 结合 。 如 果 我 们 按 
照 上 面 这 段 程序 实际 上 被 执行 的 逻辑 来 调整 代码 缩 进 ， 大 致 是 这 个 样子 : 


if (x == 6) { 


也 就 是 将 ， 如 果 x 不 等 于 0， 程 序 将 不 会 做 任何 处 理 。 如 果 要 得 到 原来 的 例子 
中 由 代码 缩 进 体现 的 编程 者 本 意 的 结果 ， 应 该 这 样 写 : 


if (x == 6) { 
if (y == 8) 


error(); 
} else { 
z=x+y; 
f(&z); 


现在 ，else 与 第 一 个 i 结合， 即使 它 离 第 二 个 if 更 近 也 是 如 此 ， 因 为 此 时 第 二 
个 if 已 经 被 括号 "封装 "起 来 了 。 


有 的 程序 设计 语言 在 if 语句 中 使 用 收尾 定 界 符 来 显 式 地 次 明 。 例 如 ， 在 Algol 
68 语 言 中 ， 前 面 提 到 的 例子 可 以 这 样 写 : 


then if y = 6 
then error 
fi 

else Z :=X+y; 
f(z) 

fi 
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是 程序 稍稍 变 长 了 一 点 。 有 些 C 程 序 员 通过 使 用 宏 定 义 也 能 达到 类 似 的 效果 : 


#define IF {if ( 
#define THEN ){ 
#define ELSE } else { 
#define FI H 


这 样 ， 上 例 中 的 C 程 序 就 可 以 写成 : 


THEN IF y == 6 


如 果 一 个 C 程 序 员 过 去 不 是 长 期 浸 淫 于 Algol 68 语 言 ， 就 会 发 现 上 面 这 段 代 码 
难于 鞭 读 。 这 样 一 种 解决 方案 所 带 来 的 问题 可 能 比 它 所 解决 的 问题 还 要 更 糟糕 。 


练习 2-1 C 语 言 允许 初始 化 列表 中 出 现 多 余 的 逗号 ， 例 如 : 


int days[] = { 31, 28, 31, 30, 31, 30, 
31, 31, 30, 31, 30, 31,}; 


为 什么 这 种 特性 是 有 用 的 ? 


练习 2-2 2.3 节 指出 了 在 C 语 言 中 以 分 写作 为 语句 结束 的 标志 所 带 来 的 一 些 问 
。 虽 然 我 们 现在 考虑 改变 C 语 言 的 这 个 规定 已 经 太 迟 ， 但 是 设想 一 下 是 否 还 有 
他 办 法 来 分 隔 语句 却 是 一 件 饶 有 趣味 的 事情 。 其 他 语言 中 是 如 何 分 隔 语句 的 

We? 这 些 方法 是 否 也 存在 它们 固有 的 缺陷 呢 ? 


E 


NI 
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在 一 个 句子 ， 哪 怕 其 中 的 每 个 单词 都 拼写 正确 ， 而 且 语 法 也 无 懈 可 击 ， 仍 然 
可 能 有 歧义 或 者 并 非 书 写 者 希望 表达 的 意思 。 程 序 也 有 可 能 表面 看 上 去 是 一 个 意 
思 ， 而 实际 上 的 意思 却 相 去 其 远 。 本 章 考察 了 知 干 种 可 能 引起 上 述 歧义 的 程序 书 


写 方式 。 

本 章 还 讨论 了 这 样 的 情形 ; 如 果 只 是 肤浅 地 考察 ， 一 切 都 “显得 ”合情合理 ， 
而 事实 上 这 种 情况 在 所 有 C 语 言 实 现 中 给 出 的 结果 都 是 未 定义 的 。 在 茶 些 C 语 言 实 
现 中 能 够 正常 工作 ， 而 在 男 一 些 C 语 言 实现 中 叉 不 能 工作 的 这 种 情形 ， 属 于 可 移 


植 性 方面 的 问题 《相关 内 容 参见 第 7 章 ) 。 


3.1 指针 与 数组 


在 C 语 言 中 ， 指 针 与 数组 这 两 个 概念 之 间 的 联系 是 如 此 密 不 可 分 ， 以 致 于 如 
果 不 能 理解 一 个 概念 ， 就 无 法 彻底 理解 男 一 个 概念 。 除 此 之 外 ，C 语 言 对 这 些 概 
念 的 处 理 ， 在 茶 些 方面 与 其 他 任何 为 人 熟知 的 程序 语言 都 有 所 不 同 。 


C 语 言 中 的 数组 值得 注意 的 地 方 有 以 下 两 点 。 


1.C 语 言 中 只 有 一 维 数组 ， 而 且 数 组 的 大 小 必须 在 编译 期 就 作为 一 个 常数 确 
定 下 来 。 不 过 ，C 语 言 中 数组 的 元 素 可 以 是 任何 类 型 的 对 象 ， 当 然 也 可 以 是 另外 
一 个 数组 。 这 样 ， 要 “仿真 "出 一 个 多 维 数组 就 不 是 一 件 难事 。 


详 注 ; 


C99 标 准 允 许 变 长 数组 CVLA) 。GCC 编 译 器 中 实现 了 变 长 数组 ， 但 细节 与 
C99 标 准 不 完全 一 致 。 感 兴趣 的 读者 可 参看 ISO/IEC 9899:1999 标准 6.7.5.2 节 ， 以 
及 Dennis M. Ritchie} Variable-Size Arrays in Co 


2. 对 于 一 个 数组 ， 我 们 只 能 做 两 件 事 : 确定 该 数组 的 大 小 以 及 获得 指 癌 该 
数组 下 标 为 0 的 元 素 的 指针 。 其 他 有 关 数 组 的 操作 ， 哪 怕 它 们 乍 看 上 去 是 以 数组 
下 标 进 行 运算 的 ， 实 际 上 都 是 通过 指针 进行 的 。 换 名 话说， 任何 一 个 数组 下 标 运 
算 都 等 同 于 一 个 对 应 的 指针 运算 ， 因 此 我 们 完全 可 以 依据 指针 行为 定义 数组 下 标 
的 行为 。 


一 旦 我 们 彻底 弄 懂 了 这 两 点 以 及 它们 所 隐 舍 的 意思 ， 那 么 理解 C 语 言 的 数组 
运算 就 不 过 是 “小 沫 一 碟 ”。 如 果 不 清楚 上 述 两 点 内 容 ， 那 么 C 语 言 中 的 数组 运算 


就 可 能 会 给 编程 人 员 带 来 许多 困惑 。 需 要 特别 指出 的 是 ， 编 程 人 员 应 该 具备 将 数 
组 运算 与 它们 对 应 的 指针 运算 融 汇 贯通 的 能 力 ， 在 思考 有 关 问 题 时 大 脑 中 对 这 两 
种 运算 能 够 自如 切换 、 坚 无 清 碍 。 许 多 程序 设计 语言 中 都 内 建 有 索引 运算 ， 在 C 
语言 中 ， 索 引 运算 是 以 指针 算术 的 形式 来 定义 的 。 


要 理解 C 语 言 中 数组 的 运作 机 制 ， 我 们 首先 必须 理解 如 何 声 明 一 个 数组 ， 例 
如 : 


int a[3]; 


这 个 语句 声明 了 a 是 一 个 拥有 3 个 整 型 元 素 的 数组 。 类 似 地 ， 


struct { 
int p[4]; 
double x; 
}b[ 17]; 
声明 了 b 是 一 个 拥有 17 个 元 素 的 数组 ， 其 中 每 个 元 素 都 是 一 个 结构 ， 该 结构 
包括 了 一 个 拥有 4 个 整 型 元 素 的 数组 〈 命 名 为 p) 和 一 个 双 精 度 类 型 的 变量 《命名 
为 x) 。 


现在 考虑 下 面 的 例子 ， 


int calendar[12][31]; 


这 个 语句 声明 calendar 是 一 个 数组 ， 该 数组 拥有 12 个 数组 类 型 的 元 素 ， 其 中 每 
个 元 素 都 是 一 个 拥有 31 个 整 型 元 素 的 数组 (而 不 是 一 个 拥有 31 个 数组 类 型 的 元 素 
的 数组 ， 其 中 每 个 元 素 又 是 一 个 拥有 12 个 整 型 元 素 的 数组 ) 。 因 此 ， 
sizeof(calendar) 的 值 是 372 (31x12) 与 sizeof(inb 的 乘积 。 


如 果 calendar 不 是 用 于 sizeof 的 操作 数 ， 而 是 用 于 其 他 场合 ， 那 么 calendar 总 是 
被 转换 成 一 个 指向 calendar 数 组 的 起 始 元 素 的 指针 。 要 理解 上 面 这 句 话 的 含义 ， 我 
们 首先 必须 理解 有 关 指 针 的 一 些 细节 。 


任何 指针 都 是 指向 茶 种 类 型 的 变量 。 例 如 ， 如 果 有 这 样 的 语句 : 


int *ip; 


就 表明 ip 是 一 个 指向 整 型 变量 的 指针 。 再 如 ， 如 果 声 明 


int i; 


那么 我 们 可 以 将 整 型 变量 i 的 地 址 赋 给 指针 ip， 就 像 下 面 这 样 : 


ip = &i; 
而 且 ， 如 果 我 们 给 *ip 赋 值 ， 就 能 够 改变 的 取 值 : 
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如 果 一 个 指针 指向 的 是 数组 中 的 一 个 元 素 ， 那 么 我 们 只 要 给 这 个 指针 加 1， 
就 能 够 得 到 指向 该 数组 中 下 一 个 元 素 的 指针 。 同 样 地 ， 如 果 我 们 给 这 个 指针 减 
1， 得 到 的 就 是 指向 该 数组 中 前 一 个 元 素 的 指针 。 对 于 除 1 之 外 其 他 整数 的 情形 ， 
以 此 类 推 。 


上 面 这 段 讨论 上 暗示 了 这 样 一 个 事实 : 给 一 个 指针 加 上 一 个 整数 ， 与 给 该 指针 
的 二 进 制 表 示 加 上 同样 的 整数 ， 两 者 的 含义 截然 不 同 。 如 果 p 指 向 一 个 整数 ， 那 
么 ip+1 指 向 的 是 计算 机 内 存 中 的 下 一 个 整数 ， 在 大 多 数 现代 计算 机 中 ， 它 都 不 同 
于 p 所 指向 地 址 的 下 一 个 内 存 位置 。 


如 果 两 个 指针 指向 的 是 同一 个 数组 中 的 元 素 ， 我 们 可 以 把 这 两 个 指针 相 减 。 
这 样 做 是 有 意义 的 ， 例 如 : 

那么 我 们 可 以 通过 gq -p 而 得 到 i 的 值 。 值 得 注意 的 是 ， 如 果 p 与 qd 指向 的 不 是 同 
一 个 数组 中 的 元 素 ， 即 使 它们 所 指向 的 地 址 在 内 存 中 的 位 置 正 好 间隔 一 个 数组 元 


素 的 整数 倍 ， 所 得 的 结果 仍然 是 无 法 保证 其 正确 性 的 。 


本 市 前 面 已 经 声明 了 a 是 一 个 拥有 3 个 整 型 元 素 的 数组 。 如 果 我 们 在 应 该 出 现 
指针 的 地 方 ， 却 采用 了 数组 名 来 亚 换 ， 那 么 数组 名 就 被 当 作 指向 该 数组 下 标 为 0 
的 元 素 的 指针 。 因 此 如 果 我 们 这 样 写 : 


p = a; 


就 会 把 数组 a 中 下 标 为 0 的 元 素 的 地 址 赋值 给 p。 注 意 ， 这 里 我 们 并 没有 写成 


p = &a; 


这 种 写法 在 ANSI C 中 是 非法 的 ， 因 为 &a 是 一 个 指向 数组 的 指针 ， 而 p 是 一 个 
指向 整 型 变量 的 指针 ， 它 们 的 类 型 不 匹配 。 大 多 数 早期 版 本 的 C 语 言 实 现 中 ， 并 
没有 所 谓 “ 数 组 的 地 址 ”这 一 概念 ， 因 此 &a 要 么 被 视 为 非法 ， 要 么 就 等 于 a。 


继续 我 们 的 讨论 。 现 在 p 指 向 数组 a 中 下 标 为 0 的 元 素 ，p+1 指 向 数组 a 中 下 标 为 
1 的 元 素 ，p+2 指 向 数组 a 中 下 标 为 2 的 元 素 ， 以 此 类 推 。 如 果 希 望 p 指 向 数组 a 中 下 
标 为 1 的 元 素 ， 可 以 这 样 写 ; 


p=p+1; 


当然 ， 该 语句 完全 等 同 于 下 面 的 写法 : 


p++; 


除了 a 被 用 作 运算 符 Sizeof 的 参数 这 一 情形 ， 在 其 他 所 有 情形 中 数组 名 a 都 代表 
指向 数组 a 中 下 标 为 0 的 元 素 的 指针 。 正 如 我 们 合乎 情理 的 期 待 ，sizeof(a) 的 结果 是 
整个 数组 a 的 大 小 ， 而 不 是 指向 数组 a 的 元 素 的 指针 的 大 小 。 


从 上 面 的 讨论 中 我 们 不 难得 出 一 个 推论 : *a 即 数组 a 中 下 标 为 0 的 元 素 的 引 
用 。 例 如 ， 我 们 可 以 这 样 写 : 


*a = 84; 


这 个 语句 将 数组 a 中 下 标 为 0 的 元 素 的 值 设置 为 4。 同 样 道理 ，*(a+1) 是 数组 a 
中 下 标 为 1 的 元 素 的 引用 ， 以 此 类 推 。 概 而 言 之 ，*(ati) 即 数组 a 中 下 标 为 的 元 素 
的 引用 ; 这 种 写法 是 如 此 常用 ， 因 此 被 简 记 为 afj]。 


正 是 这 一 概念 让 许多 C 语 言 新 手 难于 理解 。 实 际 上 ， 由 于 a+i 与 ia 的 含义 一 
样 ， 因 此 afj 与 ia] 也 具有 同样 的 含义 。 也 许 某 些 汇 编 语言 程序 员 会 发 现 后 一 种 写 
法 很 熟悉 ， 但 我 们 绝对 不 推荐 这 种 写法 。 


现在 我 们 可 以 考虑 “二 维 数组 "了 ， 正 如 前 面 所 讨论 的 ， 它 实际 上 是 以 数组 为 
元 素 的 数组 。 尽 管 我 们 也 可 以 完全 依据 指针 编写 操纵 一 维 数组 的 程序 ， 而 且 这 样 
做 在 一 维 情形 下 并 不 困难 ， 但 是 对 于 二 维 数组 ， 从 记 法 上 的 便利 性 来 说 ， 采 用 下 
标 形式 就 几乎 是 不 可 蔡 代 的 了 。 还 有 ， 如 果 我 们 仅仅 使 用 指针 来 操纵 二 维 数 组 ， 
将 不 得 不 与 C 语 言 中 最 为 “上 瞳 不 明 ” 的 部 分 打交道 ， 并 常常 遭遇 潜伏 着 的 编译 器 
bug。 


让 我 们 回 过 头 来 再 看 前 面 的 几 个 声明 : 


int calendar[12][31]; 
int *p; 
int i; 


然后 ， 考 一 考 自 己 ，calendar[4] 的 含义 是 什么 ? 


因为 calendar 是 一 个 有 着 12 个 数组 类 型 元 素 的 数组 ， 它 的 每 个 数组 类 型 元 素 叉 
是 一 个 有 着 31 个 整 型 元 素 的 数组 ， 所 以 calendar[4] 是 calendar 数 组 的 第 5 个 元 素 ， 是 
calendar 数 组 中 12 个 有 着 31 个 整 型 元 素 的 数组 之 一 。 因 此 ，calendar[4] 的 行为 也 就 
表现 为 一 个 有 着 31 个 整 型 元 素 的 数组 的 行为 。 例 如 ，sizeof(calendar[4]) 的 结果 是 
31 与 sizeof(inb0 的 乘积 。 又 如 ， 


p = calendar[4]; 


这 个 语句 使 指针 p 指 向 了 数组 calendar[4] 中 下 标 为 0 的 元 素 。 


如 果 calendar[4] 是 一 个 数组 ， 我 们 当然 可 以 通过 下 标的 形式 来 指定 这 个 数组 
中 的 元 素 ， 就 像 下 面 这样 : 


i = calendar[4][7]; 
我 们 也 确实 可 以 这 样 做 。 还 是 与 前 面 类 似 的 道理 ， 这 个 语句 可 以 写成 下 面 这 
样 而 表达 的 意思 保持 不 变 : 


i = *(calendar[4]+7); 


这 个 语句 还 可 以 进一步 写成 : 


i = *(*(calendar+4)+7); 


从 这 里 我 们 不 难 发 现 ， 用 禹 方 括号 的 下 标 形式 明显 要 比 完全 用 指针 来 表达 简 


下 面 我 们 再 看 : 


p = calendar; 


这 个 语句 是 非法 的 。 因 为 calendar 是 一 个 二 维 数 组 ， 即 “数组 的 数组 ”， 在 此 处 
的 上 下 文中 使 用 calendar 名 称 会 将 其 转换 为 一 个 指 回 数组 的 指针 ， 而 p 是 一 个 指向 
整 型 变量 的 指针 ， 这 个 语句 试图 将 一 种 类 型 的 指针 赋值 给 男 一 种 类 型 的 指针 ， 所 
以 是 非法 的 。 


很 显然 ， 我 们 需要 一 种 方法 来 声明 指向 数组 的 指针 。 经 过 了 第 2 章 对 类 似 问 
题 不 厌 其 烦 的 讨论 ， 构 造 出 下 面 的 语句 应 该 不 需要 费 多 大 力气 : 


[int (*ap)[31]; 


这 个 语句 实际 的 效果 是 ， 声 明 *ap 是 一 个 拥有 31 个 整 型 元 素 的 数组 ， 因 此 ap 就 


是 一 个 指向 这 样 的 数组 的 指针 。 因 而 ， 我 们 可 以 这 样 写 


int calendar[12][31]; 
int (*monthp)[31]; 
monthp = calendar; 


这 样 ，monthp 将 指 癌 数组 calendar 的 第 1 个 元 素 ， 也 就 是 数组 calendar 的 12 个 有 
着 31 个 元 素 的 数组 类 型 元 素 之 一 。 


假定 在 新 的 一 年 开始 时 ， 我 们 需要 清空 calendar 数 组 ， 用 下 标 形式 可 以 很 容易 
做 到 : 


int month; 
for (month=6; month<12; month++) { 
int day; 
for (day = ð; day < 31; day++) 
calendar[month][day] = 9; 


上 面 的 代码 段 如 果 采 用 指针 应 该 如 何 表示 呢 ? 我 们 可 以 很 容易 地 把 


calendar[month][day] = 9; 


表示 为 


*(*(calendar + month) + day) = Q; 


但 是 真正 有 关 的 部 分 是 哪些 呢 ? 


如 果 指 针 monthp 指 同一 个 拥有 31 个 整 型 元 素 的 数组 ， 而 calendar 的 元 素 也 是 一 
个 拥有 31 个 整 型 元 素 的 数组 ， 因 此 就 像 在 其 他 情况 中 我 们 可 以 使 用 一 个 指针 遍历 
一 个 数组 一 样 ， 这 里 同样 可 以 使 用 指针 monthp 以 步 进 的 方式 遍历 数组 calendar: 


int (*monthp)[31]; 
for (monthp = calendar; monthp < &calendar[12]; monthp++) 
/* 处 理 月 份 的 情况 */ 


> 


同样 地 ， 我 们 可 以 像 处 理 其 他 数组 一 样 ， 处 理 指针 monthp 所 指 同 的 数组 的 元 


素 : 


int (*monthp) [31]; 
for (monthp = calendar; monthp < &calendar[12]; monthp++) { 
int *dayp; 
for(dayp = *monthp; dayp<&(*monthp) [31]; dayp++) 
*dayp = @; 


到 目前 为 止 ， 我 们 a 而 且 已 经 走 得 太 远 ， 在 我 们 
控 跟 头 之 前 ， 最 好 趁早 巧 崖 勒 马 。 尺 管 本 节 最 后 一 个 例子 是 合法 的 ANSI CHEF, 
但 是 作者 还 没有 找到 一 a 过 编译 的 编译 器 (现在 大 多 数 的 C 
编译 器 能 够 接受 上 面 例子 中 的 代码 ) 。 上 面 例子 的 讨论 虽然 有 些 偏离 本 书 的 主 
题 ， 但 是 这 个 例子 能 够 很 好 地 揭示 出 C 语 言 中 数组 与 指针 之 间 的 独特 关系 ， 从 而 
更 清楚 明白 地 阐述 这 两 个 概念 。 


3.2 ” 非 数 组 的 指针 


在 C 语 言 中 ， 字 符 串 常量 代表 了 一 块 包括 字符 串 中 所 有 字符 以 及 一 个 空 字符 
(NO) 的 内 存 区 域 的 地 址 。 因 为 C 语 言 要 求 字符 串 常量 以 空 字符 作为 结束 标志 ， 
对 于 其 他 字符 叫 ，C 程 序 员 通 常 也 沿用 了 这 一 惯例 。 


假定 有 两 个 这 样 的 字符 串 s 和 t， 我 们 和 希望 将 这 两 个 字符 串 连 接 成 单个 字符 串 
r。 要 做 到 这 一 点 ， 我 们 可 以 借助 名 用 的 库 函 数 strcpy 和 strcat。 下 面 的 方法 似乎 一 
目 了 然 ， 可 是 却 不 能 满足 我 们 的 目标 : 


char *r; 
strcpy(r, s); 
strcat(r, t); 


之 所 以 不 行 ， 是 因为 不 能 确定 r 指 向 何 处 。 我 们 还 应 该 看 到 ， 不 仅 要 让 r 指 向 
一 个 地 址 ， 而 且 r 所 指向 的 地 址 处 还 应 该 有 内 存 空 间 可 供 容纳 字符 串 ， 这 个 内 存 空 
间 应 该 是 以 某 种 方式 已 经 被 分 配 了 的 。 


我 们 再 试 一 次 ， 记 住 给 r 分 配 一 定 的 内 存 空间 : 


char r[100]; 
strcpy(r, s); 


strcat(r, t); 

只 要 s 和 t 指 向 的 字符 串 并 不 是 太 大 ， 那 么 现在 我 们 所 用 的 方法 就 能 够 正常 工 
作 。 不 地 的 是 ，C 语 言 强 制 要 求 我 们 必须 声明 数组 大 小 为 一 个 常量 ， 因 此 我 们 不 
敢 确 保 r 足 够 大 。 然 而 ， 大 多 数 C 语 言 实现 为 我 们 提供 了 一 个 库 函 数 malloc， 该 函 
数 接受 一 个 整数 ， 然 后 分 配 能 够 容纳 同样 数目 的 字符 的 一 块 内 存 。 大 多 数 C 语 言 
实现 还 提供 了 一 个 库 函 数 strlen， 该 函数 返回 一 个 字符 串 中 所 包括 的 字符 数 。 有 了 
这 两 个 库 函 数 ， 似 乎 我 们 就 能 够 像 下 面 这 样 操作 了 : 


char *r, *malloc( ); 
r = malloc(strlen(s) + strlen(t)); 


strcpy(r, s); 
strcat(r, t); 


这 个 例子 还 是 错 的 ， 原 因 归 纳 起 来 有 三 个 。 


第 一 个 原因 ，malloc 函 数 有 可 能 无 法 提供 请 求 的 内 存 ， 这 种 情况 下 malloc 函 数 
会 通过 返回 一 个 空 指针 来 作为 “内 存 分 配 失败 ”事件 的 信号。 


第 二 个 原因 ， 给 r 分 配 的 内 存在 使 用 完 之 后 应 该 及 时 释放 ， 这 一 点 务必 要 记 
住 。 因 为 在 前 面 的 程序 例子 中 r 是 作为 一 个 局 部 变量 声明 的 ， 所 以 当 离 开 Ir 作 用 域 
时 ,Ir 自动 被 释放 了 。 修 订 后 的 程序 显 式 地 给 t 分 配 了 内 存 ， 为 此 就 必须 显 式 地 释 
放 内 存 。 


第 三 个 原因 ， 也 是 最 重要 的 原因 ， 就 是 前 面 的 例 程 在 调用 malloc 函 数 时 并 未 
分 配 足够 的 内 存 。 我 们 再 回忆 一 下 字符 串 以 空 字符 作为 结束 标志 的 惯例 。 库 函数 
strlen 返 回 参数 中 字符 串 所 包括 的 字符 数目 ， 而 作为 结束 标志 的 空 字符 并 未 计算 在 
内 。 因 此 ， 如 果 strlen(s) 的 值 是 n， 那 么 字符 串 实际 需要 n+1 个 字符 的 空间 。 所 以 ， 
我 们 必须 为 r 多 分 配 一 个 字符 的 空间 。 做 到 了 这 些 ， 并 且 注 意 检查 了 函数 malloc 是 
否 调 用 成 功 ， 我 们 就 能 得 到 正确 的 结 


char *r, *malloc( ); 
r = malloc(strlen(s) + strlen(t) + 1); 

if(!r) { 

complain(); 
exit(1); 
} 

strcpy(r, s); 
strcat(r, t); 


/* 一 段 时 间 之 后 再 使 用 */ 


free(r); 


3.3 ”作为 参数 的 数组 声明 


在 C 语 言 中 ， 我 们 无 法 将 一 个 数组 作为 函数 参数 直接 传递 。 如 果 我 们 将 数组 
名 作为 参数 ， 那 么 数组 名 会 立刻 被 转换 为 指向 该 数组 第 1 个 元 素 的 指针 。 例 如 ， 
下 面 的 语句 : 


声明 了 hello 是 一 个 字符 数组 。 如 果 将 该 数组 作为 参数 传递 给 一 个 函数 : 


实际 上 与 将 该 数组 第 1 个 元 素 的 地 址 作为 参数 传递 给 函数 的 作用 完全 等 效 ， 
A: 


printf("%s\n", &hello[@]); 


因此 ， 将 数组 作为 函数 参数 毫 无 意义 。 所 以 ，C 语 言 中 会 自动 地 将 作为 参数 
的 数组 声明 转换 为 相应 的 指针 声明 。 也 就 是 说 ， 像 这 样 的 写法 : 


int strlen(char s[]) 
{ 

/* 有 具体 内 容 */ 

} 


与 下 面 的 写法 完全 相同 : 


int strlen(char* s) 


{ 
} 


/* 具体 内 容 */ 


C 程 序 员 经 常 错误 地 假设 ， 在 其 他 情形 下 也 会 有 这 种 自动 转换 。4.5 节 详细 地 
讨论 了 一 个 具体 的 例子 ， 程 序 员 经 常 在 此 处 过 到 麻烦 : 


extern char *hello; 


这 个 语句 与 下 面 的 语句 有 着 天 渊 之 别 : 


extern char hello[]; 


如 果 一 个 指针 参数 并 不 实际 代表 一 个 数组 ， 即 使 从 技术 上 而 言 是 正确 的 ， 采 
用 数组 形式 的 记 法 也 经 常会 起 到 误导 作用 。 如 果 一 个 指针 参数 代表 一 个 数组 ， 情 
况 义 是 如 何 呢 ? 一 个 常见 的 例子 就 是 函数 main 的 第 二 个 参数 : 


main(int argc, char* argv[]) 


{ 
/* 具体 内 容 */ 
} 


这 种 写法 与 下 面 的 写法 完全 等 价 : 


main(int argc, char** argv) 
{ 

/* 具体 内 容 */ 

} 


需要 注意 的 是 ， 前 一 种 写法 强调 的 重点 在 于 argv 是 一 个 指向 茶 数 组 的 起 始 元 
素 的 指针 ， 该 数组 的 元 素 为 字符 指针 类 型 。 因 为 这 两 种 写法 是 等 价 的 ， 所 以 读者 
可 以 任 选 一 种 最 能 清楚 反映 自己 意图 的 写法 。 


3.4 避免 “ 举 了 唱法” 


“ 举 隅 法 ”(synecdoche) 是 一 种 文学 修辞 上 的 手段 ， 有 点 类 似 于 以 微笑 表示 
喜悦 、 狗 许 之 情 ， 或 以 隐喻 表示 指 代 物 与 被 指 物 的 相互 关系 。 在 《和 牛津 英语 群 
WY P, X” (synecdoche) 是 这 样 解 释 的 : “以 含义 更 宽泛 的 词语 来 代替 
含义 相对 较 鹤 的 词语 ， 或 者 相反 ; 例如， 以 整体 代表 部 分 ， 或 者 以 部 分 代表 整 
体 ， 以 生物 的 类 来 代表 生物 的 种 ， 或 者 以 生物 的 种 来 代表 生物 的 类 ， 等 等 。” 


《牛津 英语 辞典 》 中 这 一 词 条 的 说 明 ， 倒 是 恰如其分 地 描述 了 C 语 言 中 一 个 
常见 的 “陷阱 ”， 混 酒 指针 与 指针 所 指 同 的 数据 。 对 于 字符 串 的 情形 ， 编 程 人 员 更 
是 经 常 犯 这 种 错误 。 例 如 : 


char *p, *q; 
p = "xyz"; 


尽管 某 些 时 候 我 们 不 妨 认 为 ， 上 面 的 赋值 语句 使 得 p 的 值 就 是 字符 捉 "xyz"， 
然而 实际 情况 并 不 是 这 样 ， 记 住 这 一 点 尤其 重要 。 实 际 上 ，p 的 值 是 一 个 指向 
由 X 、y、2Z 和 \0' 这 4 个 字符 组 成 的 数组 的 起 始 元 素 的 指针 。 因 此 ， 如 果 我 们 执行 
下 面 的 语句 : 


q=pP; 


PREE NA I AEE ESEK E LAEE A ET AS il 
内 存 中 的 字符 。 我 们 可 以 用 图 3-1 来 表示 这 种 情况 。 


图 3-1 ”指针 复制 示意 图 


需要 记 住 的 是 ， 复 制 指针 并 不 同时 复制 指针 所 指 回 的 数据 。 
因此 ， 当 我 们 执行 完 下 面 的 语句 之 后 : 
q[1] = 'Y'; 


qd 所 指向 的 内 存 现在 存储 的 是 字符 串 XYz'。 因 为 p 和 q 所 指向 的 是 同一 块 内 
存 ， 所 以 p 指 加 的 内 存 中 存储 的 当然 也 是 字符 串 XxYz。 


译注 ; 

ANSI C 标 准 中 禁止 对 string literal 做 出 修改 。K&R C 中 对 这 一 问题 的 说 明 是 ， 
试图 修改 字符 串 常 量 的 行为 是 未 定义 的 。 某 些 C 编 译 器 还 允许 q[1] = 'Y' 这 种 修改 
行为 ， 如 LCC v3.6。 但 是 ， 这 种 写法 不 值得 提倡 。 


3.5” 空 指针 并 非 空 字符 串 


除了 一 种 重要 的 例外 情况 ， 在 C 语 言 中 将 一 个 整数 转换 为 一 个 指针 ， 最 后 得 
到 的 结果 都 取决 于 具体 的 C 编 译 器 实现 。 这 种 例外 情况 就 是 常数 0， 编 译 器 保证 由 
0 转换 而 来 的 指针 不 等 于 任何 有 效 的 指针 。 出 于 代码 文档 化 的 考虑 ， 常 数 0 这 个 值 
经 常用 一 个 符号 来 代 蔡 : 
#define NULL 6 

当然 无 论 是 直接 用 常数 0， 还 是 用 符号 NULL， 效 果 都 是 相同 的 。 需 要 记 住 的 
重要 一 点 是 ， 当 溃 数 0 被 转换 为 指针 使 用 时 ， 这 个 指针 绝对 不 能 被 解除 引用 
(dereference) 。 换 句 话 说， 在 将 0 赋值 给 一 个 指针 变量 时 ， 我 们 绝对 不 能 企图 使 
用 该 指针 所 指向 的 内 存 中 存储 的 内 容 。 下 面 的 写法 是 完全 合法 的 : 


if (p == (char *) @) ... 
但 是 如 果 要 写成 这 样 : 
if (strcmp(p, (char *) @) == @) ... 


就 是 非法 的 了 ， 原 因 在 于 库 函 数 stremp 的 实现 中 会 包括 一 个 操作 ， 用 于 查看 
它 的 指针 参数 所 指 加 内存 中 的 内 容 。 


如 果 p 是 一 个 空 指针 ， 甚 至 


printf(p); 
和 


printf("%s", p); 


的 行为 也 是 未 定义 的 。 而 且 ， 与 此 类 似 的 语句 在 不 同 的 计算 机 上 也 会 有 不 同 


的 效果 。7.6 市 详细 讨论 了 这 个 问题 。 


3.6 ”边界 计算 与 不 对 称 边界 


如 果 一 个 数组 有 10 个 元 素 ， 那 么 这 个 数组 下 标的 允许 取 值 范围 是 什么 呢 ? 


这 个 问题 对 于 不 同 的 程序 设计 语言 有 着 不 同 的 答案 。 例 如 ， 对 于 Fortran、 
PL/ 以 及 Snobol4 等 程序 语言 ， 这 个 数组 的 下 标 取 值 缺 省 从 1 开始 ， 而 且 这 些 语言 
也 允许 编程 人 员 男 外 指定 数组 下 标的 起 始 值 。 而 对 于 Algol 和 Pascal 语 言 ， 数 组 下 
标 疫 有 缺 省 的 起 始 值 ， 编 程 人 员 必 须 显 式 地 指定 每 个 数组 的 下 界 与 上 界 。 在 标准 
的 Basic 语 言 中 ， 声 明 一 个 拥有 10 个 元 素 的 数组 ， 实 际 上 编译 器 分 配 了 11 个 元 素 的 
空间 ， 下 标 范围 从 0 到 10。 


译注 : 


在 Basic 中 声明 数组 时 实际 上 指定 的 是 上 界 ， 而 下 界 默认 为 0。 


Dim Counters(14) As Integer eS) ota 
Dim Sums(20) As Double ea i ie 


Basic 中 也 可 以 同时 指定 数组 上 界 与 下 界 ， 如 : 
Dim Counters(1 To 15) As Integer 


Dim Sums(100 To 120) As String 


在 C 语 言 中 ， 这 个 数组 的 下 标 范 围 是 从 0 到 9。 在 一 个 拥有 10 个 元 素 的 数组 
中 ， 存 在 下 标 为 0 的 元 素 ， 却 不 存在 下 标 为 10 的 元 素 。 在 C 语 言 中 ， 一 个 拥有 n 个 


元 素 的 数组 ， 却 不 存在 下 标 为 n 的 元 素 ， 其 元 素 的 下 标 范 围 是 从 0 到 n-1。 为 此 ， 
由 其 他 程序 语言 转 而 使 用 C 语 言 的 程序 员 在 使 用 数组 时 特别 要 注意 。 


例如 ， 让 我 们 仔细 地 来 看 看 本 书 导读 中 的 一 段 代 码 : 


int i, a[10]; 


for (i=1; i<=10; i++) 
a[i] = ð; 


这 段 代 码 本 意 是 要 将 数组 a 中 所 有 元 素 设置 为 0， 却 产生 了 一 个 出 人 意料 的 “ 副 
作用 ”。 在 for 语 句 的 比较 部 分 本 来 是 i < 10， 却 写成 了 i <= 10， 因 此 实际 上 并 不 存 
在 的 a[10] 被 设置 为 0， 也 就 是 内 存 中 在 数组 a 之 后 的 一 个 字 〈word) 的 内 存 被 设置 
为 0。 如 果 用 来 编译 这 段 程序 的 编译 器 按照 内 存 地 址 递减 的 方式 来 给 变量 分 配 内 
存 ， 那 么 内 存 中 数组 a 之 后 的 一 个 字 (wod) 实际 上 是 分 配给 了 整 型 变量 1。 此 
时 ， 本 来 循环 计数 器 的 值 为 10， 循 环 体内 将 并 不 存在 的 a[10] 设 置 为 0%， 实 际 上 却 
是 将 计数 器 i 的 值 设置 为 0， 这 就 陷入 了 一 个 死 循环 。 


尽管 C 语 言 的 数组 会 让 新 手感 到 麻烦 ,但 是 这 种 特别 的 设计 正 是 其 最 大 优势 
所 在 。 要 理解 这 一 点 ， 需 要 做 一 些 解释 。 


在 所 有 和 常见 的 程序 设计 错误 中 ， 最 难于 察觉 的 一 类 是 “栏杆 错误 ”， 也 第 被 称 
为 “ 差 一 错误 ”(off-by-one error) 。 还 记得 本 书 第 0 章 中 的 练习 0-2 提 出 的 问题 吗 ? 
那个 问题 说 的 是 : 100 英 尺 长 的 围栏 每 陋 10 英 尺 需 要 一 根 文 撑 用 的 栏杆 ， 共 需要 
多 少 根 栏杆 呢 ? 如 果 不 假 思 索 ， 最 “显而易见 ”的 答案 是 将 100 除 以 10， 得 到 的 结 
是 10， 即 需要 10 根 栏杆 。 当 然 ， 这 个 答案 是 错误 的 ， 正 确 答案 是 11。 


也 许 ， 得 出 正确 答案 的 最 容易 方式 是 这 样 考 虑 : 要 文 撑 10 英 矿 长 的 围栏 实际 
需要 两 根 栏 杆 ， 两 端 各 一 根 。 这 个 问题 的 另 一 种 考虑 方式 是 : 除了 最 右 侧 的 一 段 
围栏 ， 其 他 每 一 段 10 瑞 尺 长 的 围栏 都 只 在 左 侧 有 一 根 栏 杆 ， 而 例外 的 最 右 侧 一 段 
围栏 不 仅 左 侧 有 一 根 栏杆 ， 右 侧 也 有 一 根 栏杆 。 


前 面 一 段 讨 论 了 解决 这 个 问题 的 两 种 方法 ， 实 际 上 提示 了 我 们 避免 “栏杆 错 
误 ” 的 两 个 通用 原则 。 


1. 首先 考虑 最 简单 情况 下 的 特例 ， 然 后 将 得 到 的 结果 外 推 ， 这 是 原则 一 。 
2. 仔细 计算 边界 ， 绝 不 掉以轻心 ， 这 是 原则 二 。 


将 上 面 总 结 的 内 容 牢记 在 心 以 后 ， 我 们 现在 来 看 整数 范围 的 计算 。 例 如 ， 假 
定 整 数 x 满 足 边 界 条 件 x>=16 且 x<=37， 那 么 此 范围 内 x 的 可 能 取 值 个 数 有 多 少 ? 换 
句 话说 ， 整 数 序 列 16，17，...，37 共 有 多 少 个 元 素 ? 很 显然 ， 答 案 与 37-16《〈 亦 即 
21) 非常 接近 ， 那 么 到 底 是 20、21， 还 是 22 呢 ? 


根据 原则 1， 我 们 考虑 最 简单 情况 下 的 特例 。 这 里 假定 整数 x 的 取 值 范围 上 有 界 
与 下 界 重合 ， 即 x>=16 且 x<=16， 显 然 合理 的 x 取 值 只 有 1 个 整数 ， 即 16。 所 以 当 上 
界 与 下 界 重 合 时 ， 此 范围 内 满足 条 件 的 整数 序列 只 有 1 个 元 素 。 


再 考虑 一 般 的 情形 : 假定 下 界 为 ， 上 界 为 h。 如 果 满 足 条 件 “ 上 界 与 下 界 重 
合 ”"， 即 1 =h， 亦 即 h -1= 0。 根 据 特例 外 推 的 原则 ， 我 们 可 以 得 出 满足 条 件 的 整 
数 序 列 有 h - 1 + 1 个 元 素 。 在 本 例 中 ， 就 是 37 - 16+ 1， 即 22。 


造成 < 栏杆 错误 ”的 根源 正 是 中 -1+ 1 中 的 “+ 1”。 一 个 字符 串 中 由 下 标 为 16 到 
下 标 为 37 的 字符 元 素 所 组 成 的 子 串 ， 它 的 长 度 是 多 少 呢 ? 稍 不 留意 ， 就 会 得 到 错 
误 的 结果 21。 很 自然 地 ， 人 们 会 问 这 样 一 个 问题 : 是 否 存在 一 些 编程 技巧 ， 能 够 
降低 这 类 错误 发 生 的 可 能 性 呢 ? 


这 个 编程 技巧 不 但 存在 ， 而 且 可 以 一 言 以 丽 之 : 用 第 一 个 入 界 点 和 第 一 个 出 
界 点 来 表示 一 个 数值 范围 。 具 体 而 言 ， 前 面 的 例子 我 们 不 应 说 整数 x 满足 边界 条 
件 x>16 且 x<37， 而 是 说 整数 x 满足 边界 条 件 x>16 且 x<38。 注 意 ， 这 里 下 界 是 “入 界 
点 ”， 即 包括 在 取 值 范围 之 中 ， 而 上 界 是 “出 界 点 ”， 即 不 包括 在 取 值 范围 之 中 。 这 
种 不 对 称 也 许 从 数学 上 而 言 并 不 优美 ， 但 是 它 对 于 程序 设计 的 简化 效果 却 足 以 令 


人 吃惊。 


1. 取 值 范围 的 大 小 就 是 上 界 与 下 界 之 差 。38-16 的 值 是 22， 恰 恰 是 不 对 称 边 
界 16 和 38 之 间 所 包括 的 元 素数 目 。 


2. 如 果 取 值 范 围 为 空 ， 那 么 上 界 等 于 下 界 。 这 和 是 第 1 条 的 直接 推论 。 
3. 即使 取 值 范围 为 室 ， 上 界 也 永远 不 可 能 小 于 下 界 。 


对 于 像 C 这 样 的 数组 下 标 从 0 开始 的 语言 ， 不 对 称 边界 给 程序 设计 带 来 的 便利 
尤其 明显 : 这 种 数组 的 上 界 〈 即 第 一 个 “出 界 点 ”) 恰 是 数组 元 系 的 个 数 ! 因此 ， 
如 果 我 们 要 在 C 语 言 中 定义 一 个 拥有 10 个 元 素 的 数组 ， 那 么 0 就 是 数组 下 标的 第 一 
个 “入 界 点 ”《〈 指 处 于 数组 下 标 范围 以 内 的 点 ， 包 括 边 界 点 ) ， 而 10 就 是 数组 下 标 
中 的 第 一 个 “出 界 点 ”《〈 指 不 在 数组 下 标 范围 以 内 的 点 ， 不 含 边 界 点 ) 。 正 因 如 
此 ， 我 们 这 样 写 : 


int a[10], i; 
for (i = 0; i < 10; i++) 
a[i] = ð; 


而 不 是 写成 下 面 这 样 ， 


int a[10], i; 
for (i = 03 i <= 9; i++) 
a[i] = ð; 


让 我 们 作 一 个 假设 ， 如 果 C 语 言 的 for 语 句 风 格 类 似 Algol 或 者 Pascal 语 言 ， 那 
么 就 会 带 来 一 个 问题 : 下 面 这 个 语句 的 含义 究竟 是 什么 ? 


for (i = @ to 10) 
a[i] = ð; 


如 果 10 是 包括 在 取 值 范 围 内 的 “入 界 点 ”， 那 么 i 将 取 11 个 值 ， 而 不 是 10 个 值 ; 
如 果 10 是 不 包括 在 取 值 范围 内 的 “出 界 点 ”， 那 么 原来 以 其 他 程序 语言 为 背景 的 纺 
程 人 员 会 大 为 惊讶 。 


另 一 种 考虑 不 对 称 边界 的 方式 是 ， 把 上 界 视 作 某 序列 中 第 一 个 被 占用 的 元 
素 ， 而 把 下 界 视 作 序列 中 第 一 个 被 释放 的 元 素 ， 如 图 3-2 所 示 。 


| | 
“入 界 ” 下 界 | 


“出 界 ” ER 


图 3-2 ”数组 不 对 称 边界 示意 图 


当 处 理 各 种 不 同类 型 的 缓冲 区 时 ， 这 种 看 待 问题 的 方式 特别 有 用 。 例 如 ， 考 
虑 这 样 一 个 函数 ， 该 函数 的 功能 是 将 长 度 无 规律 的 输入 数据 送 到 缓冲 区 〈 即 一 块 
能 够 容纳 N 个 字符 的 内 存 〉 中 去 ， 每 当 这 块 内 存 被 “ 填 满 *? 时 ， 就 将 缓冲 区 的 内 容 
写 出 。 绥 冲 区 的 声明 可 能 是 下 面 这 个 样子 : 


#define N 1024 
static char buffer[N]; 
我 们 再 设置 一 个 指针 变量 ， 让 它 指向 缓冲 区 的 当前 位 置 : 


对 于 指针 bufptr， 我 们 应 该 把 重点 放 在 哪个 方面 呢 ? 是 让 指针 bufptr 始 终 指向 
缓冲 区 中 最 后 一 个 已 占用 的 字符 ， 还 是 让 它 指向 缓冲 区 中 第 一 个 未 占用 的 字符 ? 
前 一 种 选择 很 有 吸引 力 ， 但 是 考虑 到 我 们 对 “不 对 称 边界 ”的 仿 好 ， 后 一 种 选择 更 
为 适合 。 


按照 “不 对 称 边界 ”的 惯例 ， 我 们 可 以 这 样 编写 语句 : 
*bufptr++ = C; 


这 个 语句 把 输入 字符 c 放 到 缓冲 区 中 ， 然 后 指针 bufptr 递 增 1， 又 指向 缓冲 区 中 


第 1 个 未 占用 的 字符 。 
根据 前 面 对 “ 不 对 称 边 界 ? 的 考察 ， 当 指针 bufptr 与 &buffer[0] 相 等 时 ， 绥 冲 区 
存放 的 内 容 为 空 ， 因 此 初始 化 时 声明 缓冲 区 为 空 可 以 这 样 写 : 


bufptr = &buffer[@]; 


或 者 ， 更 简洁 一 点 ， 直接 写成 : 


bufptr = buffer; 


任何 时 候 缓冲 区 中 已 存放 的 字符 数 都 是 bufptr - buffer， 因 此 我 们 可 以 通过 将 
这 个 表达 式 与 N 作 比较 ， 来 判断 缓冲 区 是 否 已 满 。 当 缓冲 区 全 部 “ 填 满 *? 时 ， 表 达 
式 bufptr -buffer 就 等 于 N， 可 以 推断 缓冲 区 中 未 占用 的 字符 数 为 N - (bufptr - 
buffer) 。 


一 旦 掌握 了 前 面 所 有 这 些 预备 知识 ， 我 们 就 可 以 开始 编写 程序 了 ， 假 设 这 个 
函数 的 名 称 是 pufwrite。 函 数 bufwritef 有 两 个 参数 : 第 一 个 参数 是 一 个 指针 ， 指 疝 
将 要 写 入 缓冲 区 的 第 1 个 字符 ;第 二 个 参数 是 一 个 整数 ， 代 表 将 要 写 入 缓冲 区 的 
字符 数 。 假 定 我 们 可 以 调用 函数 ftushbuffer 来 把 缓冲 区 中 的 内 容 写 出 ， 而 且 函 数 
flushbuffer 会 重 置 指针 bufptr， 使 其 指向 缓冲 区 的 起 始 位 置 ， 如 下 所 示 : 


void 
bufwrite(char *p, int n) 


while (--n >= 0) { 
if (bufptr == &buffer[N]) 
flushbuffer() ; 
*bufptr++ = *p++; 


重复 执行 表达 式 --n >= 0 只 是 进行 n 次 迭代 的 一 种 方法 。 要 验证 这 一 点 ， 我 们 
可 以 考察 最 简单 的 特例 情形 n = 1*。 因 为 循环 执行 np 次 ， 每 次 迭代 从 输入 缓冲 区 中 
取 走 一 个 字符 ， 所 以 输入 的 每 个 字符 都 将 得 到 处 理 ， 而 且 也 不 会 额外 执行 多 余 的 


处 理 操作 。 


TE: 


在 大 多 数 C 语 言 实 现 中 ，--n >= 0 至 少 与 等 效 的 n-- > 0 一 样 快 ， 甚 至 在 茶 些 C 实 
现 中 还 要 更 快 。 第 一 个 表达 式 --n >= 0 的 大 小 先 从 n 中 减 去 1， 然 后 将 结果 与 0 比 
较 ; 第 二 个 表达 式 则 移 保 存 n， 从 n 中 减 去 1， 然 后 比较 保存 值 与 0 的 大 小 。 某 些 编 
译 器 如 果 足 够 聪明 ， 可 以 发 现 后 一 个 操作 有 可 能 按照 比 写 出 来 的 更 有 效率 的 方式 
执行 。 但 是 我 们 不 应 该 依赖 这 一 点 。 


我 们 注意 到 前 面 代 码 段 中 出 现 了 bufptr 与 &buffer[N] 的 比较 ， 而 buffer[N] 这 个 
元 素 是 不 存在 的 ! 数组 buffer 的 元 素 下 标 从 0 到 N - 1， 根 本 不 可 能 是 N。 我 们 用 这 
种 写法 : 
if (bufptr == &buffer[N]) 


代替 了 下 面 等 效 的 写法 : 


if (bufptr > &buffer[N - 1]) 


原因 在 于 我 们 要 坚持 遵循 “不 对 称 边界 ”的 原则 : 我 们 要 比较 指针 bufptr 与 缓冲 
区 后 第 一 个 字符 的 地 址 ， 而 &buffer[N] 正 是 这 个 地 址 。 但 是 ， 引 用 一 个 并 不 存在 
的 元 素 又 有 什么 意义 呢 ? 


幸运 的 是 ， 我 们 并 不 需要 引用 这 个 元 素 ， 而 只 需要 引用 这 个 元 素 的 地 址 ， 并 
且 这 个 地 址 在 我 们 遇 到 的 所 有 C 语 言 实 现 中 又 是 “ 千 真 万 确 ?存在 的 。 而 且 ，ANSI 
C 标 准 也 明确 允许 这 种 用 法 : 数组 中 实际 不 存在 的 “ 洲 界 ”元 素 的 地 址 位 于 数组 所 
占 内 存 之 后 ， 这 个 地 址 可 以 用 于 进行 赋值 和 比较 。 当 然 ， 如 果 要 引用 该 元 素 ， 那 


就 是 非法 的 了 。 


按照 前 面 的 写法 ， 程 序 已 经 能 够 工作 ， 但 是 我 们 还 可 以 进一步 优化 ， 以 提高 
程序 的 运行 速度 。 尽 管 程序 优化 问题 超过 了 本 书 所 涉及 的 范围 ， 但 这 个 特定 的 例 
子 中 还 是 有 值得 我 们 考察 其 有 关 计 数 方面 的 特性 。 


这 个 程序 绝 大 部 分 的 开销 来 自 于 每 次 达 代 都 要 进行 的 两 个 检查 :一 个 检查 用 
于 判断 循环 计数 顺 是 否 到 达 终 值 ， 另 一 个 检查 用 于 判断 缓冲 区 是 否 己 满 。 这 样 做 
的 结果 就 是 一 次 只 能 转移 一 个 字符 到 缓冲 区 。 


假定 我 们 有 一 种 方法 能 够 一 次 移动 k 个 字符 。 大 多 数 C 语 言 实现 (以 及 全 部 正 
确 的 ANSI C 实 现 ) 都 有 一 个 库 函 数 memcpy， 可 以 做 到 这 一 点 ， 而 且 这 个 函数 通 
常 是 用 汇编 语言 实现 的 ， 可 以 提高 运行 速度 。 即 使 你 的 C 语 言 实现 没有 提供 这 个 
函数 ， 自 己 写 一 个 也 很 容易 : 


void 
memcpy(char *dest, const char *source, int k) 


while (--k >= 0) 
*dest++ = *source+t++; 


我 们 现在 可 以 让 函数 bufwrite 利 用 库 函 数 memcpy 来 一 次 转移 一 批 字符 到 绥 冲 
区 ， 而 不 是 一 次 仅 转移 一 个 字符 。 循 环 中 的 每 次 迭代 在 必要 时 会 刷新 缓存 ， 计 算 
需要 移动 的 字符 数 ， 移 动 这 些 字 符 ， 最 后 恰当 地 更 新 计数 器 ， 如 下 所 示 : 


void 
bufwrite(char *p, int n) 


{ 


while (n > @) { 
int k, rem; 
if (bufptr == &buffer[N]) 
flushbuffer (); 
rem = N - (bufptr - buffer); 
k =n > rem? rem: n; 
memcpy(bufptr, p, k); 
bufptr += k; 
p += k; 
n -= k; 


很 多 编程 人 员 在 写 出 这 样 的 程序 时 ， 总 是 感到 有 些 犹豫 不 决 ， 他 们 担心 可 能 
会 写 错 。 而 有 的 程序 员 似 乎 很 有 些 “ 大 无 其 "精神 ， 最 后 结果 还 是 写 错 了 。 确 实 ， 
像 这 样 的 代码 搁 巧 性 很 强 ， 如 果 没 有 很 好 的 理由 ， 我 们 不 应 该 尝试 去 做 。 但 是 如 
果 “ 师 出 有 名 ”， 那 么 理解 这 样 的 代码 应 该 如 何 写 就 很 重要 了 。 只 要 我 们 记 住 前 面 
的 两 个 原则 特例 外 推 法 和 仔细 计算 边界 ) ， 就 应 该 完全 有 信心 做 对 。 


在 循环 的 入 口 处 ，n 是 需要 转移 到 绥 冲 区 的 字符 数 。 因 此 ， 只 要 n 还 大 于 0， 
也 就 是 还 有 剩余 字符 没有 被 转移 ， 循 环 就 应 该 继续 进行 下 去 。 每 次 进入 循环 体 ， 
我 们 将 要 转移 k 个 字符 到 缓冲 区 中 ， 而 不 是 像 过 去 一 样 每 次 只 转移 一 个 字符 。 在 
上 面 的 代码 中 ， 最 后 4 行 语句 管理 着 字符 转移 的 过 程 : (1) 从 缓冲 区 中 第 1 个 未 
占用 字符 开始 ， 复 制 k 个 字符 到 其 中 ; (2) 将 指针 bufptr 指 向 的 地 址 前 移 k 个 字 
符 ， 使 其 仍然 指向 缓冲 区 中 第 1 个 未 占用 字符 ，(3) 输入 字符 串 的 指针 p 前 移 k 个 
字符 ; O 将 n《〈 即 竺 转移 的 字符 数 ) 减 去 k。 我 们 很 容易 看 到 ， 这 些 语句 正确 
地 完成 了 各 自 的 任务 。 


在 循环 的 一 开始 ， 仍 然 保 留 了 原来 版 本 中 的 第 一 个 检查 ， 如 果 绥 冲 区 已 满 ， 
则 刷新 之 ， 并 重 置 指针 bufptr。 这 就 保证 了 在 检查 之 后 ， 绥 冲 区 中 还 有 空间 。 


唯一 困难 的 部 分 就 是 确定 k， 即 在 保证 缓冲 区 安全 不 发 生 溢出 〉 的 情况 下 
可 以 一 次 转移 的 最 多 字符 数 。k 是 下 面 两 个 数 中 较 小 的 一 个 : 输入 数据 中 还 剩余 
的 待 转移 字符 数 〈 即 n) ， 以 及 缓冲 区 中 未 占用 的 字符 数 〈 即 rem) 。 


计算 rem 的 方法 有 两 种 。 前 面 的 例子 显示 了 其 中 的 一 种 : 缓冲 区 中 当前 可 用 
FZ Crem) ， 是 缓冲 区 中 总 的 字符 数 N) 减 去 已 占用 的 字符 数 《〈 即 bufptr 
—buffer) 的 差 ， 也 就 是 N - (bufptr - buffer). 


男 一 种 计算 rem 的 方法 是 把 绥 冲 区 中 的 空余 部 分 看 作 一 个 区 间 ， 直 接 计算 这 
个 区 间 的 长 度 。 指 针 bufptr 指 癌 这 个 区 间 的 起 点 ， 而 buffer + N〈 也 就 是 


&buffer[N]〉 指 向 这 个 区 间 的 终点 (出 界 点 )。 此 外 ， 它 们 满足 “不 对 称 边界 ”的 
条 件 ， 指 针 bufptr 由 于 指向 的 是 第 1 个 未 占用 字符 ， 因 此 是 “入 界 点 ”;， 而 &buffer[N] 
所 代表 的 位 置 在 数组 buffer 最 后 一 个 元 素 buffer[N - 1] 之后， 因此 是 “出 界 点 ”。 所 
以 ， 根 据 我 们 的 这 一 观点 ， 绥 冲 区 中 的 可 用 字符 数 为 (buffer + N) - bufptr。 稍 作 思 
考 ， 我 们 就 会 及 现 


(buffer + N) - bufptr 


完全 等 价 于 


N - (bufptr - buffer) 


再 看 一 个 与 计数 有 关 的 例子 。 在 这 个 例子 中 ， 我 们 需要 编写 一 个 程序 ， 该 程 
序 按 一 定 顺 序 生 成 一 些 整数 ， 并 将 这 些 整数 按 列 输出 。 把 这 个 例子 的 要 求 说 得 更 
明确 一 点 就 是 : 程序 的 输出 可 能 包括 知 干 页 的 整数 ， 每 页 包括 NCOLS 列 ， 每 列 又 
包括 NROWS 个 元 素 ， 每 个 元 素 就 是 一 个 待 输出 的 整数 。 还 要 注意 ， 程 序 生成 的 
整数 是 按 列 连续 分 布 的 ， 而 不 是 按 行 分 布 的 。 


对 于 这 个 例子 ， 我 们 关注 的 重点 应 该 放 在 与 计数 有 关 的 特性 方面 ， 因 此 不 妨 
再 做 一 些 简 化 的 假设 。 首 先 ， 我 们 假定 这 个 程序 是 由 两 个 函数 print 和 flush 来 实现 
的 。 而 决定 哪些 数值 应 该 打印 是 其 他 程序 的 责任 。 每 当 有 新 的 数值 生成 时 ， 这 
个 “其 他 程序 ?就 会 把 该 数值 作为 参数 传递 给 函数 print， 要 注意 函数 print 仅 当 缓 冲 
区 已 满 时 才 打 印 ， 未 满 时 将 该 数值 存 入 缓冲 区 ;而 当 最 后 一 个 数值 生成 出 来 之 
后 ， 就 会 调用 函数 flush 刷 新 ， 此 时 无 论 缓冲 区 是 否 已 满 ， 其 中 所 有 数值 都 将 被 打 
印 。 其 次 ， 我 们 假定 打印 任务 分 别 由 3 个 函数 完成 : 函数 printnum 在 本 页 的 当前 位 
置 打 印 一 个 数值 ;函数 printnl 则 打印 一 个 换行 符 ， 另 起 新 的 一 行 ， 函 数 printpage 则 
打印 一 个 分 页 符 ， 另 起 新 的 一 页 。 每 一 行 都 必须 以 换行 符 结束 ， 即 使 是 一 页 中 的 
最 后 一 行 ， 也 必须 以 换行 符 结束 后 ， 再 打印 一 个 分 页 符 。 这 些 打印 函数 按照 从 左 
到 右 的 顺序 “填充 ”每 个 输出 行 ， 一 行 被 打印 后 ， 就 不 能 被 撤销 或 变更 。 


对 于 这 个 问题 ， 我 们 需要 意识 到 的 第 一 点 就 是 ， 如 果 要 完成 程序 要 求 的 任 
务 ， 某 种 形式 的 缓冲 区 必 不 可 少 。 我 们 必须 在 看 到 第 1 列 的 所 有 元 素 之 后 ， 才 可 
能 知道 第 2 列 的 第 1 个 元 素 〈“ 即 第 1 行 的 第 2 个 元 素 ) 的 和 内容。 但是， 我们 又 必须 在 
打印 完 第 1 行 之 后 ， 才 有 可 能 打印 第 1 列 的 第 2 个 元 素 〈 即 第 2 行 的 第 1 个 元 素 )〉。 


这 个 缓冲 区 应 该 有 多 大 呢 ? 乍 一 看 来 ， 缓 冲 区 似乎 需要 能 够 大 到 足以 容纳 一 
整 页 的 数值 。 细 细 一 想 ， 并 不 需要 这 么 大 的 空间 。 因 为 按照 问题 的 定义 ， 我 们 知 
道 每 页 的 列 数 与 行 数 ， 那 么 对 于 最 后 一 列 中 的 每 个 元 素 ， 也 就 是 相应 行 的 最 后 一 
个 元 素 ， 只 要 我 们 得 到 和 它 的 数值 ， 就 可 以 立即 打印 出 来 。 因 此 ， 我 们 的 缓冲 区 不 
必 包 括 最 后 一 列 : 


#define BUFSIZE (NROWS*(NCOLS-1)) 
static int buffer[BUFSIZE]; 

我 们 之 所 以 声明 buffer 为 静态 数组 ， 是 为 了 预防 它 被 程序 的 其 他 部 分 存 取 到 。 
4.3 节 详细 讨论 了 static 声 明 。 


我 们 对 函数 print 的 编程 策略 大 致 如 下 : 如 果 绥 冲 区 未 满 ， 就 把 生成 的 数值 放 
到 缓冲 区 中 ;， 如 果 绥 冲 区 已 满 ， 此 时 读 入 的 数值 就 是 一 页 中 最 后 1 列 的 茶 个 元 
素 ， 这 时 就 打印 出 该 元 素 所 对 应 的 行 ( 按 照 上 一 段 中 所 讲 的 ， 这 个 元 素 可 以 直接 
打印 ， 不 必 放 入 缓冲 区 )〉 。 当 一 页 中 的 所 有 行 都 已 经 输出 后 ， 我 们 就 清空 缓冲 
区 。 


需要 注意 ， 这 些 整 数 进入 缓冲 区 的 顺序 与 出 缓冲 区 的 顺序 并 不 一 致 : 我 们 是 
按 列 接受 数值 ， 却 是 按 行 打印 数值 。 这 就 出 现 了 一 个 问题 ， 在 缓冲 区 中 ， 是 同一 
行 的 元 素 相 邻 排列 ， 还 是 同一 列 的 元 素 相 邻 排列 ? 我 们 可 以 任意 选择 一 种 方式 ， 
这 里 假定 是 同一 列 的 元 素 相 邻 排列 。 这 种 选择 使 所 有 数值 进入 绥 冲 区 非常 直 截 了 
当 : 径直 连续 排列 下 去 就 是 了 。 但 是 出 缓冲 区 的 方式 却 相 对 复杂 一 些 。 要 跟踪 元 
素 进 入 缓冲 区 时 所 处 的 位 置 ， 一 个 指针 就 足够 了 。 我 们 可 以 初始 化 这 个 指针 ， 使 
其 指向 缓冲 区 的 第 1 个 元 素 : 


static int *bufptr = buffer; 

现在 ， 我 们 对 函数 print 的 结构 算是 有 了 一 点 眉目 。 函 数 print 接 受 一 个 整 型 参 
数 ， 如 果 绥 冲 区 还 有 空间 ， 就 将 其 置 入 绥 冲 区 ; 否则， 执行 “ 某 些 暂 时 不 能 确定 的 
操作 ”。 让 我 们 把 到 目前 为 止 对 函数 print 的 一 些 认识 记录 下 来 : 


void 
print(int n) 
{ 
if (bufptr == &buffer[BUFSIZE]) { 
/* 某 些 暂时 不 能 确定 的 操作 */ 


}else 


*bufptr++ == n; 


这 里 的 “ 某 些 暂 时 不 能 确定 的 操作 ”包括 打印 当前 行 的 所 有 元 素 ; 使 当前 行 的 
序号 递增 1;， 如 果 一 页 内 的 所 有 行 都 已 经 打印 ， 则 男 起 新 的 一 页 。 为 了 做 到 这 
些 ， 我 们 显然 需要 记 住 当前 行 号 。 为 此 ， 我 们 声明 一 个 局 部 静态 变量 row 来 存储 
当前 行 号 。 


我 们 如 何 做 到 打印 当前 行 的 所 有 元 素 呢 ? 告 一 想 似乎 漫 无 头绪 ， 实 际 上 如 果 
看 待 问题 的 方式 恰当 ， 也 就 是 俗话 所 说 的 “思路 对 了 ”， 则 相当 简单 。 我 们 知道 ， 
对 于 序号 为 row 的 行 ， 其 第 1 个 元 素 就 是 buffer[row]， 并 且 元 素 buffer[row] 肯 定 存 
在 。 因 为 元 素 buffer[row] 属 于 第 1 列 ， 如 果 它 不 存在 ， 则 我 们 根本 不 可 能 通过 if 语 
句 的 条 件 判 断 。 我 们 还 知道 ， 同 一 行 中 的 相 邻 元 素 在 缓冲 区 中 是 相隔 NROWS 个 
元 素 排列 的 。 最 后 ， 我 们 知道 指针 bufptr 指 向 的 位 置 刚 好 在 缓冲 区 中 最 后 一 个 已 占 
用 元 素 之 后 。 因 此 ， 我 们 可 以 通过 下 面 这 个 循环 语句 来 打印 缓冲 区 中 属于 当前 行 
的 所 有 元 素 ( 注 意 ， 当 前 行 的 最 后 一 个 元 素 不 在 缓冲 区 ， 所 以 是 “缓冲 区 中 属于 当 
前 行 的 所 有 元 素 *”， 而 不 是 “当前 行 的 所 有 元 素 ”) : 


int *p; 
for (p = buffer+row; p < bufptr; p += NROWS) 
printnum(*p); 


这 里 为 了 简洁 起 见 ， 我 们 用 buffer+row 人 代替 了 &buffer[row] 。 


剩 下 的 “和 暂时 不 能 确定 的 操作 ?就 很 简单 了 : 打印 当前 输入 数值 〈 即 当前 行 的 
最 后 一 个 元 素 ) ， 打 印 换行 符 以 结束 当前 行 ， 如 果 是 一 页 的 最 后 一 行 ， 还 要 另 起 
新 的 一 页 : 


printnum(n) ; /* 打印 当前 行 的 最 后 一 个 元 素 */ 
printnl(); /* 另 起 新 的 一 行 */ 
if (++row == NROWS) { 
printpage() ; 
row = @; /* 重 置 当前 行 写 */ 
bufptr = buffer; /* 重 置 指针 pufptr */ 


因此 ， 最 后 的 print 函 数 看 上 去 就 像 下 面 这 样 : 


void 
print(int n) 
{ 
if (bufptr == &buffer[BUFSIZE]) { 
static int row = ©; 
int *p; 
for (p = buffer+row; p < bufptr; 
p += NROWS) 
printnum(*p) ; 
printnum(n) ; /* 打印 当前 行 的 最 后 一 个 元 素 */ 
printn1(); /* 另 起 新 的 一 行 */ 
if (++row == NROWS) { 
printpage(); 
row = ð; /* 重 置 当 前 行 序号 */ 
bufptr = buffer; /* 重 置 指针 bufptr */ 
} 
} else 
*bufptr++ = n; 
} 


现在 我 们 接近 大 功 告 成 了 : 只 需要 编写 函数 flush， 它 的 作用 是 打印 缓冲 区 中 
所 有 剩余 元 素 。 要 做 到 这 一 点 ， 基 本 机 制 与 函数 print 中 打印 当前 行 所 有 元 素 类 
似 ， 只 需要 将 其 作为 内 循环 ， 在 其 上 男 外 套 一 个 外 循环 (作用 是 志 历 一 页 中 的 每 
一 行 ) : 


int row; 


for (row = @; row < NROWS; row++) { 


int *p; 
for (p = buffer + row; p < bufptr; 
p += NROWS) 
printnum(*p) ; 
printnl(); 


} 
printpage(); 
} 


函数 fhush 的 这 个 版 本 显得 有 些 太 中 规 中 矩 、 平 淡 无 奇 了 : 如 果 最 后 一 页 只 包 
括 一 列 甚至 是 不 完全 的 一 列 ， 函 数 flush 仍 然 会 逐 行 打 印 出 全 部 的 一 页 ， 只 不 过 没 
有 元 素 的 地 方 都 是 空白 而 已 。 事 实 上 ， 即 使 最 后 一 页 为 空 ， 函 数 flush 仍 然 还 会 全 
部 打印 出 来 ， 只 不 过 一 页 全 是 空白 而 已 。 从 技术 上 说 ， 这 种 做 法 虽然 也 满足 了 问 
题 定 义 中 的 要 求 ， 但 却 不 符合 程序 美学 的 观点 。 如 果 没 有 数值 可 供 打印 ， 就 应 该 
立即 停止 打印 。 我 们 可 以 通过 计算 缓冲 区 中 有 多 少 项 来 做 到 这 一 点 。 如 果 绥 冲 区 
中 什么 也 没有 ， 我 们 并 不 需要 开始 新 的 一 页 : 


void 
flush() 


int row; 
int k = bufptr - buffer; /* i} K PR 
if (k > NROWS) 


cr 
= 


余 项 的 数目 */ 


k = NROWS; 
if (k > @) { 
for (row = @; row < k; row++) { 
int *p; 
for (p = buffer + row; p < bufptr; 
p += NROWS) 
printnum(*p); 
printnl(); 


printpage(); 


3.7 求 值 顺序 


2.2 节 讨论 了 运算 符 优先 级 的 问题 。 求 值 顺序 则 完全 是 男 一 码 事 。 运 算 符 优 先 
级 是 关于 诸如 表达 式 


atb*c 


应 该 被 解释 成 


(a+b) # <C 


的 这 样 一 类 规则 。 求 值 顺序 是 另 一 类 规则 ， 可 以 保证 下 面 这 样 的 语句 


if (count != 6 && sum/count < smallaverage) 
printf( "average < %g\n", smallaverage) ; 


即使 当 变 量 count 为 0 时 ， 也 不 会 产生 一 个 “用 0 作 除 数 ” 的 错误 。 


C 语 言 中 的 某 些 运算 符 总 是 以 一 种 已 知 的 、 规 定 的 顺序 来 对 其 操作 数 进行 求 
值 ， 而 另外 一 些 则 不 是 这 样 。 例 如 ， 考 虑 下 面 的 表达 式 : 


a<b &&c<d 


C 语 言 的 定义 中 说 明 a < b 应 当 首 移 被 求 值 。 如 果 a 确 实 小 于 b， 此 时 必须 进 一 
步 对 c < d 求 值 ， 以 确定 整个 表达 式 的 值 。 但 是 ， 如 果 a 大 于 或 等 于 b， 则 无 须 对 c < 
d 求 值 ， 表 达 式 肯定 为 假 。 


男 外 ， 要 对 a <b 求 值 ， 编 译 器 可 能 先 对 a 求 值 ， 也 可 能 先 对 b 求 值 ， 在 某 些 机 
髓 上 甚至 有 可 能 对 它们 同时 并 行 求 值 。 


C 语 言 中 只 有 4 个 运算 符 〈&&、|| 、?: 和 ,) 存在 规定 的 求 值 顺序 。 运 算 符 && 
和 运算 符 | 首先 对 左 侧 操 作 数 求 值 ， 只 在 需要 时 才 对 右 侧 操作 数 求 值 。 运 算 符 ?: 有 
3 个 操作 数 ， 在 a?b:c 中 ， 操 作 数 a 首先 被 求 值 ， 根 据 a 的 值 再 求 操作 数 b 或 c 的 值 。 喜 
号 运算 符 则 首先 对 左 侧 操作 数 求 值 ， 然 后 “丢弃 ?该 值 ， 再 对 右 侧 操作 数 求 值 。 


ve: 


分 隔 函 数 参数 的 逗号 并 非 喜 号 运算 符 。 例 如 ，x 和 y 在 函数 ftx, y) 中 的 求 值 顺 
序 是 未 定义 的 ， 而 在 函数 g( (x, y) ) 中 却 是 确定 的 先 x 后 y 的 顺序 。 在 后 一 个 例子 
中 ， 函 数 g 只 有 一 个 参数 。 这 个 参数 的 值 是 这 样 求 得 的 : 移 对 x 求 值 ， 然 后 “丢弃 ? 
的 值 ， 接 着 求 y 的 值 。 


C 语 言 中 其 他 所 有 运算 符 对 其 操作 数 求 值 的 顺序 是 未 定义 的 。 特 别 是 ， 赋 值 
运算 符 并 不 保证 任何 求 值 顺序 。 


运算 符 && 和 运算 符 || 对 于 保证 检查 操作 按照 正确 的 顺序 执行 至 关 重 要 ， 例 
如 ， 在 语句 


if (y != © && x/y > tolerance) 
complain(); 


中 ， 就 必须 保证 仅 当 y 非 0 时 才 对 xy 求 值 。 


下 面 这 种 从 数组 x 中 复制 前 n 个 元 素 到 数组 y 中 的 做 法 是 不 正确 的 ， 因 为 它 对 
求 值 顺序 做 了 六 多 的 假设 : 


i = ð; 
while (i < n) 
y[i] = x[it+]; 


问题 出 在 哪里 呢 ? 上 面 的 代码 假设 yD] 的 地 址 将 在 i 的 目 增 操作 执行 之 前 被 求 
值 ， 这 一 点 并 没有 任何 保证 ! 在 C 语 言 的 茶 些 实现 上 ， 有 可 能 在 i 目 增 之 前 被 求 
值 ， 而 在 男 外 一 些 实现 上 ， 有 可 能 与 此 相反 。 同 理 ， 下 面 这 种 版 本 的 写法 与 前 类 
似 ， 也 不 正确 : 


i = ð; 
while (i < n) 
y[i++] = x[i]; 


但 是 下 面 这 种 写法 却 能 正确 工作 : 


i = 60; 

while (i < n) { 
yli] = x[i]; 
i++; 

} 


当然 ， 这 种 写法 可 以 简写 为 : 


for (i = ð; i < n; i++) 
y[i] = x[i]; 


3.8 运算 符 攻 发、|| A! 


C 语 言 中 有 两 类 逻辑 运算 符 ， 某 些 时 候 可 以 互 换 : 按 位 运算 符 &&、| 和 ~， 以 及 
逻辑 运算 符 &&、|| 和 ! 。 如 果 程 序 员 用 其 中 一 类 的 茶 个 运算 符 蔡 换 抒 另 一 类 中 对 
应 的 运算 符 ， 他 也 许 会 大 吃 一 惊 : 互 换 之 后 程序 看 上 去 还 能 “正常 ?工作 ， 但 实际 
上 这 只 是 巧合 所 致 。 


按 位 运算 符 &、| 和 ~ 对 操作 数 的 处 理 方式 是 将 其 视 作 一 个 二 进 制 的 位 序列 ， 
分 别 对 其 每 个 位 进行 操作 。 例 如 ，10&12 的 结果 是 8〈 二 进 制 表示 为 1000) ， 因 为 
运算 符 & 按 操作 数 的 二 进 制 表示 逐 位 比较 10〈 二 进 制 表示 为 1010) 和 12 二进制 
表示 为 1100) ， 当 且 仅 当 两 个 操作 数 的 二 进 制 表示 的 某 位 上 同时 是 1 时 ， 最 后 结 
果 的 二 进 制 表 示 中 该 位 才 是 1。 同 理 ，10|12 的 结果 是 14 (二 进 制 表示 为 1110)， 
而 ~10 的 结果 是 -11 (二 进 制 表 示 为 11...110101)〉 ， 至 少 在 以 二 进 制 补 码 表示 负数 
的 机 器 上 是 这 个 结果 。 


逻辑 运算 符 &&、| 和 ! 对 操作 数 的 处 理 方式 是 : 要 么 将 其 视 作 “ 真 "， 要 么 将 
其 视 作 “ 假 "。 通 常 约定 将 0 视 作 “ 假 ”， 而 非 0 视 作 “ 真 *。 这 些 运 算 符 当 结 
为 “ 真 ? 时 返回 1， 当 结果 为 “ 假 ? 时 返回 0， 它 们 只 可 能 返回 0 或 1。 除 此 之 外 ， 运 算 
符 && 和 运算 符 || 在 左 侧 操作 数 的 值 能 够 确定 最 终结 果 时 ， 根 本 不 会 对 右 侧 操作 数 
求 值 。 


因此 ， 我 们 能 够 很 容易 求 得 这 个 表达 式 的 结果 : !10 的 结果 是 0， 因 为 10 是 非 0 
数 ;，10&&12 的 结果 是 1， 因 为 10 和 12 都 不 是 0; 10||12 的 结果 也 是 1， 因 为 10 不 是 
0。 而 且 ， 在 最 后 一 个 式 子 中 ，12 根 本 不 会 被 求 值 ， 在 表达 式 10||f( ) 中 ，f( ) 也 不 会 
被 求 值 。 


考虑 下 面 的 代码 段 ， 其 作用 是 在 表 中 查询 一 个 特定 的 元 素 : 


i = ð; 
while (i < tabsize && tab[i] != x) 


| i++; | 


这 个 循环 语句 的 用 意 是 : 如 果 i 等 于 tabsize 则 循环 终止 ， 这 说 明 在 表 中 没有 发 
现 要 找 的 元 素 ; 而 如 果 是 其 他 情况 ， 此 时 i 的 值 束 是 要 找 的 元 素 在 表 中 的 索引 。 注 
意 在 这 个 循环 中 用 到 了 不 对 称 边界 。 


假定 我 们 无 意 中 用 运算 符 & 葵 换 了 上 面 语句 中 的 运算 符 &&: 


i = ð; 
while (i < tabsize & tab[i] != x) 


i++; 


这 个 循环 语句 也 有 可 能 “正常 ”工作 ， 但 仅仅 是 因为 两 个 非常 侥幸 的 原因 。 


第 一 个 "侥幸 "是 ，while 中 的 表达 式 & 运 算 符 的 两 侧 都 是 比较 运算 ， 而 比较 运 
算 的 结果 在 为 真 "时 等 于 1， 在 为 “ 假 "时 等 于 0。 只 要 x 和 y 的 取 值 都 限制 在 0 或 1， 
x&y 与 x&c&y 就 总 是 得 出 相同 的 结果 。 然 而 ， 如 果 两 个 比较 运算 中 的 任何 一 个 用 除 
1 之 外 的 非 0 数 代表 “ 真 "， 那 么 这 个 循环 就 不 能 正常 工作 了 。 


第 二 个 “侥幸 是， 对 于 数组 结尾 之 后 的 下 一 个 元 妹 〈 实 际 上 是 不 存在 的 ) ， 
只 要 程序 不 去 改变 该 元 素 的 值 ， 而 仅仅 读 取 它 的 值 ， 一 般 情况 下 是 不 会 有 什么 危 
害 的 。 运 算 符 & 和 运算 符 && 不 同 ， 运 算 符 区 两 侧 的 操作 数 都 必须 被 求 值 。 所 以 在 
后 一 个 代码 段 中 ， 如 果 tabsize 等 于 tab 中 的 元 素 个 数 ， 当 循环 进入 最 后 一 次 迭代 
时 ， 即 使 i 等 于 tabsize， 也 就 是 说 ， 数 组 元 素 tab[j 实 际 上 并 不 存在 ， 程 序 仍 然 会 查 
看 元 素 的 值 。 


回忆 一 下 我 们 在 3.6 节 中 曾经 提 到 的 内 容 : 对 于 数组 结尾 之 后 的 下 一 个 元 素 ， 
取 它 的 地 址 是 合法 的 。 在 这 一 节 中 ， 我 们 试图 去 实际 地 读 取 这 个 元 素 的 值 ， 这 种 
做 法 的 结果 是 未 定义 的 ， 而 且 绝 少 有 C 编 译 咒 能够 检测 出 这 个 错误 。 


3.9 ”整数 溢出 


C 语 言 中 存在 两 类 整数 算术 运算 : 有 符号 运算 与 无 符号 运算 。 在 无 符号 算术 
运算 中 ， 没 有 所 谓 的 “ 浇 出 一次: 所 有 无 符号 运算 都 是 以 2 的 n 次 方 为 模 ， 这 里 n 是 
结果 中 的 位 数 。 如 果 算 术 运 算 符 的 一 个 操作 数 是 有 符号 整数 ， 另 一 个 是 无 符号 整 
数 ， 那 么 有 符号 整数 会 被 转换 为 无 符号 整数 , “溢出 ?也 不 可 能 及 生 。 但 是 ， 当 两 
个 操作 数 都 是 有 符号 整数 时 ,， “溢出 ”就 有 可 能 发 生 ， 而 且 “ 溢 出 ”的 结果 是 未 定义 
的 。 当 一 个 运算 的 结果 发 生 “ 溢 出 * 时 ， 做 出 任何 假设 都 是 不 安全 的 。 


例如 ， 假 定 a 和 b 是 两 个 非 负 整 型 变量 ， 我 们 需要 检查 a+b 是 否 会 溢出 ”。 一 种 
想当然 的 方式 是 这 样 : 


if (a +b < @) 
complain(); 


这 并 不 能 正常 运行 。 当 a+b 确 实 发 生 * 洪 出 ?时 ， 所 有 关于 结果 如 何 的 假设 都 不 
再 可 笔 。 例 如 ， 在 茶 些 机 器 上 ， 加 法 运算 将 设置 一 个 内 部 寄存 器 为 4 种 状态 之 
一 : 正 、 负 、 零 和 溢出 。 在 这 种 机 器 上 ，C 编 译 器 完全 有 理由 这 样 来 实现 上 面 的 
例子 ， 即 a 与 b 相 加 ， 然 后 检查 该 内 部 寄存 器 的 标志 是 否 为 " 负 ”。 当 加 法 操作 发 
生 “ 湾 出 ?时 ， 这 个 内 部 寄存 器 的 状态 是 溢出 而 不 是 负 ， 那 么 计 语 句 的 检查 就 会 失 
败 。 


一 种 正确 的 方式 是 将 a 和 b 都 强制 转换 为 无 符号 整数 : 


if ((unsigned)a + (unsigned)b > INT_MAX) 
complain(); 


此 处 的 INT_MAX 是 一 个 已 定义 常量 ， 代 表 可 能 的 最 大 整数 值 。ANSI CHRE 
在 <limits.h> 中 定义 了 INT_MAX; 如 果 是 在 其 他 C 语 言 实现 中 ， 读 者 也 许 需要 自己 
重新 定义 。 


不 需要 用 到 无 符号 算术 运算 的 男 一 种 可 行 方法 是 : 


if (a > INT_MAX - b) 
complain(); 


3.10 ”为 函数 main 提 供 返 回 值 


最 简单 的 C 程 序 也 许 是 像 下 面 这 样 : 


main() 
{ 
} 


这 个 程序 包含 一 个 不 易 察觉 的 错误 。 函 数 main 与 其 他 任何 函数 一 样 ， 如 果 并 
未 显 式 声明 返回 类 型 ， 那 么 函数 返回 类 型 就 默认 为 整 型 。 但 是 这 个 程序 并 没有 给 
出 任何 返回 值 。 


通常 说 来 ， 这 不 会 造成 什么 危害 。 一 个 返回 值 为 整 型 的 函数 如 果 返 回 失败 ， 
实际 上 是 隐 含 地 返回 了 某 个 “垃圾 ?整数 。 只 要 该 数值 不 被 用 到 ， 就 无 关 紧 要 。 


然而 ， 在 茶 些 情形 下 函数 main 的 返回 值 并 非 无 关 紧 要 。 大 多 数 C 语 言 实 现 都 

过 函数 main 的 返回 值 来 告知 操作 系统 该 函数 的 执行 是 成 功 还 是 失败 。 典 型 的 处 
en 
一 个 程序 的 main 函 数 并 不 返回 任何 值 ， 那 么 有 可 能 看 上 去 执行 失败 。 如 果 正 在 使 
用 一 个 软件 管理 系统 ， 该 系统 关注 程序 被 调用 后 执行 是 成 功 还 是 失败 ， 那 么 很 可 
能 得 到 令 人 惊讶 的 结果 。 


严格 说 来 ， 我 们 前 面 最 简单 的 C 程 序 应 该 像 下 面 这 样 编写 代码 : 


main() 
return ð; 
} 
或 者 写成 : 
main() 


exit(@); 
} 


最 为 经 典 的 “hello world” 程 序 看 上 去 应 该 像 这 样 : 


#include <stdio.h> 


main() { 
printf("hello world\n"); 
return ð; 


} 


练习 3-1 假定 对 于 下 标 越 界 的 数组 元 素 ， 取 其 地 址 是 非法 的 ， 那 么 3.6 市 中 
的 bufwrite 程 序 应 该 如 何 写 呢 ? 


练习 3-2 ”比较 3.6 节 中 函数 flush 的 最 后 一 个 版 本 与 以 下 版 本 : 


int row; 
int k = bufptr - buffer; 
if (k > NROWS) 
k = NROWS; 
for (row = ð; row < k; row++) { 
int *p; 
for (p = buffer + row; p < bufptr; 
p += NROWS) 
printnum(*p) ; 
printnl(); 


} 
if (k > 6) 
printpage(); 


练习 3-3 ”编写 一 个 函数 ， 对 一 个 已 排序 的 整数 表 执 行 二 分 查找 。 函 数 的 输入 
包括 一 个 指向 表 头 的 指针 、 表 中 的 元 素 个 数 以 及 待 查 找 的 数值 。 函 数 的 输出 是 一 
个 指向 满足 碍 找 要 求 的 元 素 的 指针 ; 当 未 碍 找到 满足 要 求 的 数值 时 ， 输 出 一 个 
NULL 指 针 。 


第 4 章 ”链接 


一 个 C 程 序 可 能 是 由 多 个 分 别 编译 的 部 分 组 成 ， 这 些 不 同 部 分 通过 一 个 通常 
叫 作 链接 妖 《〈 也 叫 链接 编辑 器 ， 或 载 入 器 ) 的 程序 合并 成 一 个 整体 。 因 为 编译 器 
般 每 次 只 处 理 一 个 文件 ， 所 以 它 不 能 检测 出 那些 需要 一 次 了 解 多 个 源 程序 文件 
才能 察觉 的 错误 。 此 外 ， 在 许多 系统 中 链接 器 是 独立 于 C 语 言 实现 的 ， 因 此 ， 如 
果 前 述 错误 的 原因 是 与 C 语 言 相关 的 ， 链 接 器 对 此 同样 束 手 无 集 。 


某 些 C 语 言 实 现 提 供 了 一 个 称 为 lint 的 程序 ， 可 以 捕获 到 大 量 的 此 类 错误 ,但 
遗憾 的 是 并 非 所 有 的 C 语 言 实现 都 提供 了 该 程序 。 如 果 能 够 找到 诸如 lint 的 程序 ， 
就 一 定 要 善 加 利用 ， 这 一 点 无 论 怎么 强调 都 不 为 过 。 


在 本 章 中 ， 我 们 将 考察 一 个 典型 的 链接 器 ， 注 意 它 是 如 何 对 C 程 序 进行 处 理 
的 ， 从 而 归纳 出 一 些 由 于 链接 器 的 特点 而 可 能 导致 的 错误 。 


4.1 什么 是 链接 器 


C 语 言 中 的 一 个 重要 思想 就 是 分 别 编译 (separate compilation) ， 即 若干 个 源 
程序 可 以 在 不 同 的 时 候 单 独 进行 编译 ， 然 后 在 恰当 的 时 候 整 合 到 一 起 。 但 是 ， 链 
接 器 一 般 是 与 C 编 译 器 分 离 的 ， 它 不 可 能 了 解 C 语 言 的 诸多 细节 。 那 么 ， 链 接 器 是 
如 何 做 到 把 知 干 个 C 源 程序 合并 成 一 个 整体 呢 ? 尽管 链接 器 并 不 理解 C 语 言 ， 然 而 
它 却 能 够 理解 机 器 语言 和 内 存 布局 。 编 译 器 的 责任 是 把 C 源 程序 “翻译 ”成 对 链接 
器 有 意义 的 形式 ， 这 样 链接 器 就 能 够 “ 读 懂 ”C 源 程序 了 。 


典型 的 链接 器 把 由 编译 器 或 汇编 器 生成 的 在 干 个 目标 模块 ， 整 合成 一 个 被 称 
为 载 入 模块 或 可 执行 文件 的 实体 一 一 该 实体 能 够 被 操作 系统 直接 执行 。 其 中 ， 茶 
些 目 标 模块 是 直接 作为 输入 提供 给 链接 器 的 ， 而 男 外 一 些 目 标 模块 则 是 根据 链接 
过 程 的 需要 ， 从 包括 有 类 似 printf 函 数 的 库 文件 中 取得 的 。 


链接 器 通常 把 目标 模块 看 成 是 由 一 组 外 部 对 象 Cexternal object) 组 成 的 。 每 
个 外 部 对 象 代表 着 机 器 内 存 中 的 某 个 部 分 ， 并 通过 一 个 外 部 名 称 来 识别 。 因 此 ， 
程序 中 的 每 个 函数 和 每 个 外 部 变量 ， 如 果 没 有 被 声明 为 static， 就 都 是 一 个 外 部 对 
象 。 某 些 C 编 译 器 会 对 静态 函数 和 静态 变量 的 名 称 做 一 定 改 变 ， 将 它们 也 作为 外 
部 对 象 。 由 于 经 过 了 “名 称 修饰 >”， 因 此 它们 不 会 与 其 他 源 程序 文件 中 的 同名 函数 
或 同名 变量 发 生命 名 冲突 。 


大 多 数 链接 器 都 禁止 同一 个 载 入 模块 中 的 两 个 不 同 外 部 对 象 拥有 相同 的 名 
称 。 然而， 在 将 多 个 目标 模块 整合 成 一 个 载 入 模块 时 ， 这 些 目 标 模块 可 能 就 包含 
了 同名 的 外 部 对 象 。 链 接 器 的 一 个 重要 工作 就 是 处 理 这 类 命名 冲突 。 


处 理 命名 冲突 最 简单 的 办 法 就 是 干脆 完全 禁止 。 对 于 外 部 对 象 是 函数 的 情 
形 ， 这 种 做 法 当然 正确 ， 一 个 程序 如 果 包 括 两 个 同名 的 不 同 函 数 ， 编 译 器 根本 就 
不 应 该 接受 ， 而 对 于 外 部 对 象 是 变量 的 情形 ， 问 题 就 变 得 有 些 困 难 了 。 不 同 的 链 


接 右 对 这 种 情形 有 着 不 同 的 处 理 方 式 ， 我 们 将 在 后 面 看 到 这 一 点 的 重要 性 。 


有 了 这 些 信息 ， 我 们 现在 可 以 大 致 想象 出 链接 器 是 如 何 工作 的 了 。 链 接 絮 的 
输入 是 一 组 目标 模块 和 库 文件 。 链 接 器 的 输出 是 一 个 载 入 模块 。 链 接 嚣 读 入 目标 
模块 和 库 文件 ， 同 时 生成 载 入 模块 。 对 每 个 目标 模块 中 的 每 个 外 部 对 象 ， 链 接 器 
都 要 检查 载 入 模块 ， 看 是 否 已 有 同名 的 外 部 对 象 。 如 果 没 有 ， 和 链接 器 就 将 该 外 部 
对 象 添加 到 载 入 模块 中 ， 如 果 有 ， 和 链接 器 就 要 开始 处 理 命名 冲突 。 


除了 外 部 对 象 ， 目 标 模块 还 可 能 包括 了 对 其 他 模块 中 的 外 部 对 象 的 引用 ， 例 
如 ， 一 个 调用 了 函数 printf 的 C 程 序 所 生成 的 目标 模块 ， 就 包括 了 一 个 对 函数 printf 
的 引用 。 可 以 推测 得 出 ， 该 引用 指向 的 是 一 个 位 于 茶 个 库 文件 中 的 外 部 对 象 。 在 
链接 器 生成 载 入 模块 的 过 程 中 ， 它 必须 同时 记录 这 些 外 部 对 象 的 引用 。 当 链接 器 
读 入 一 个 目标 模块 时 ， 它 必须 解析 出 这 个 目标 模块 中 定义 的 所 有 外 部 对 象 的 引 
用 ， 并 做 出 标记 说 明 这 些 外 部 对 象 不 再 是 未 定义 的 。 


因为 链接 器 对 C 语 言 “知之 其 少 ”， 所 以 有 很 多 错误 不 能 被 检测 出 来 。 再 次 强 
调 ， 如 果 读者 的 C 语 言 实现 中 提供 了 lint 程 序 ， 切 记 要 使 用 ! 


42 声明 与 定义 


下 面 的 声明 语句 : 


如 果 其 位 置 出 现在 所 有 函数 体 之 外 ， 就 将 其 称 为 外 部 对 象 a 的 定义 。 这 个 语 名 
说 明 a 是 一 个 外 部 整 型 变量 ， 同 时 为 a 分 配 了 存储 空间 。 因 为 外 部 对 象 a 并 没有 被 明 
确 指定 任何 初始 值 ， 所 以 它 的 初始 值 默 认为 0《〈 某 些 系统 中 的 链接 器 对 以 其 他 语 
言 编 写 的 程序 并 不 保证 这 一 点 ，C 编 译 器 有 责任 以 适当 方式 通知 链接 器 ， 确 保 未 
指定 初始 值 的 外 部 变量 被 初始 化 为 0) 。 


下 面 的 声明 语句 : 


int a = 7; 
在 定义 a 的 同时 也 为 a 明 确 指 定 了 初始 值 。 这 个 语句 不 仅 为 a 分 配 内 存 ， 也 说 明 
了 在 该 内 存 中 应 该 存储 的 值 。 


下 面 的 声明 语句 : 


extern int a; 

并 不 是 对 a 的 定义 。 这 个 语句 仍然 说 明 a 是 一 个 外 部 整 型 变量 ， 但 是 因为 它 包 
括 了 extern 关 键 字 ， 这 就 显 式 地 说 明了 a 的 存储 空间 是 在 程序 的 其 他 地 方 分 配 的 。 
从 链接 器 的 角度 来 看 ， 上 述 声明 是 一 个 对 外 部 变量 a 的 引用 ， 而 不 是 对 a 的 定义 。 
因为 这 种 形式 的 声明 是 对 一 个 外 部 对 象 的 显 式 引 用 ， 即 使 它 出 现在 一 个 函数 的 内 
部 ， 也 仍然 具有 同样 的 含义 。 下 面 的 函数 srand 在 外 部 变量 random_seed 中 保存 了 
其 整 型 参数 n 的 一 份 副本 : 


void 
srand(int n) 


extern int random_seed; 
random_seed = n; 


每 个 外 部 对 象 都 必须 在 程序 某 个 地 方 进行 定义 。 因 此 ， 如 果 一 个 程序 中 包括 
了 语句 


extern int a; 
那么 ， 这 个 程序 就 必须 在 别 的 某 个 地 方 包括 语句 
int a; 


这 两 个 语句 既 可 以 是 在 同一 个 源 文件 中 ， 也 可 以 位 于 程序 的 不 同 源 文件 之 
中 。 


如 果 一 个 程序 对 同一 个 外 部 变量 的 定义 不 止 一 次 ， 又 将 如 何 处理 呢 ? 也 就 是 
说 ， 假 定 下 面 的 语句 
int a; 

出 现在 两 个 或 者 更 多 的 不 同 源 文 件 中 ， 人 情况 会 是 怎样 呢 ? 或 者 说 ， 如 果 语 名 


出 现在 一 个 源 文件 中 ， 而 语句 


int a = 9; 


出 现在 男 一 个 源 文件 中 ， 将 出 现 什么 样 的 情形 呢 ? 这 个 问题 的 答案 与 系统 有 
关 ， 不 同 的 系统 可 能 有 不 同 的 处 理 方式 。 严 格 的 规则 是 ， 每 个 外 部 变量 只 能 定义 
一 次 。 如 果 外 部 变量 的 多 个 定义 各 指定 一 个 初始 值 ， 例 如 ; 


int a = 7; 


出 现在 一 个 源 文件 中 ， 而 


int a = 9; 


出 现在 男 一 个 源 文件 中 ， 大 多 数 系 统 都 会 拒绝 接受 该 程序 。 但 是 ， 如 果 一 个 
外 部 变量 在 多 个 源 文件 中 定义 却 并 没有 指定 初始 值 ， 那 么 茶 些 系统 会 接受 这 个 程 
序 ， 而 另外 一 些 系统 则 不 会 接受 。 要 想 在 所 有 的 C 语 言 实 现 中 避免 这 个 问题 ， 唯 
一 的 解决 办 法 就 是 每 个 外 部 变量 只 定义 一 次 。 


4.3 ”命名 冲突 与 static 修 饰 符 


两 个 具有 相同 名 称 的 外 部 对 象 实际 上 代表 的 是 同一 个 对 象 ， 即 使 编程 人 员 的 
本 意 并 非 如 此 ， 系 统 也 会 如 此 处 理 。 因 此， 如 果 在 两 个 不 同 的 源 文件 中 都 包括 了 
定义 
int a; 

那么 它 要 么 表示 程序 错误 〈 如 果 链 接 器 禁止 外 部 变量 重复 定义 的 话 ) ， 要 人 么 
在 两 个 源 文件 中 共享 的 同一 个 实例 (无论 两 个 源 文件 中 的 外 部 变量 a 是 否 应 该 共 


[= 


= 


即使 其 中 a 的 一 个 定义 是 出 现在 系统 提供 的 库 文件 中 ， 也 仍然 进行 同样 的 处 
理 。 当 然 ， 一 个 设计 良好 的 函数 库 不 致 于 将 a 定 义 为 外 部 名 称 。 但 是 ， 要 了 解 函数 
库 中 定义 的 所 有 外 部 对 象 的 名 称 却 也 并 非 易 事 。 类 似 于 read 和 write 这 样 的 名 称 不 
难 狂 到， 但 其 他 的 名 称 就 没有 这 么 容易 了 。 


ANSI C 定 义 了 C 标 准 函 数 库 ， 列 出 了 经 常用 到 因而 可 能 会 引发 命名 冲突 的 所 
有 函数 。 这 样 ， 我 们 就 可 以 避免 与 库 文件 中 的 外 部 对 象 名 称 发 生 冲 突 。 如 果 一 个 
库 函 数 需要 调用 另 一 个 未 在 ANSI C 标 准 中 列 出 的 库 函 数 ， 那 么 它 应 该 以 “隐藏 名 
称 ” 来 调用 后 者 。 这 就 使 得 程序 员 可 以 定义 一 个 函数 ， 比 如 函数 名 为 read， 而 不 用 
担心 库 函 数 getc 本 应 调用 库 文 件 中 的 read 函 数 ， 却 调用 了 这 个 用 户 定义 的 read 函 
数 。 但 大 多 数 C 语 言 实现 并 不 是 这 样 做 的 ， 因 此 这 类 命名 冲突 仍然 是 一 个 问题 。 


static 修 饰 符 是 一 个 能 够 减少 此 类 命名 冲突 的 有 用 工具 。 例 如 ， 以 下 声明 语句 


static int a; 


其 含义 与 下 面 的 语句 相同 : 


int a; 


只 不 过 ，a 的 作用 域 限制 在 一 个 源 文件 内 ， 对 于 其 他 源 文 件 ，a 是 不 可 见 的 。 


因此 ， 如 果 知 干 个 函数 需要 共 孚 一 组 外 部 对 象 ， 可 以 将 这 些 函 数 放 到 一 个 源 文件 


Tyke te 


中 ， 把 它们 需要 用 到 的 对 象 也 都 在 同一 个 源 文 件 中 以 static 修 饰 符 声 明 。 


static 修 饰 符 不 仅 适 用 于 变量 ， 也 适用 于 函数 。 如 果 函 数 {f 需 要 调用 另 一 个 函数 
g， 而 且 只 有 函数 {f 需 要 调用 函数 g， 我 们 可 以 把 函数 人 与 函数 g 都 放 到 同一 个 源 文件 
中 ， 并 且 声 明 函 数 g 为 static: 


static int 
g(int x) 
{ 


/* geass */ 
} 


void f() { 
{ 


/* 其 他 内 容 */ 
b = g(a); 


我 们 可 以 在 多 个 源 文件 中 定义 同名 的 函数 g， 只 要 所 有 的 函数 g 都 被 定义 为 
static， 或 者 仅 其 中 一 个 函数 g 不 是 static。 因 此 ， 为 了 避免 可 能 出 现 的 命名 冲突 ， 
如 果 一 个 函数 仅仅 被 同一 个 源 文件 中 的 其 他 函数 调用 ， 我 们 就 应 该 声明 该 函数 为 


Static. 


44 形 参 、 实 参与 返回 值 


任何 C 函 数 都 有 一 个 形 参 列表 ， 列 表 中 的 每 个 参数 都 是 一 个 变量 ， 该 变量 在 
函数 调用 过 程 中 被 初始 化 。 下 面 这 个 函数 有 一 个 整 型 形 参 : 


int 
abs(int n) 


return n<@? -n: n; 


} 


而 对 某 些 函 数 来 说 ， 形 参 列表 为 空 。 例 如 : 


void 
eatline() 
{ 
int c; 
do c = getchar(); 
while (c != EOF && c != '\n'); 
} 


函数 调用 时 ， 调 用 方 将 实 参 列表 传递 给 被 调 函 数 。 在 下 面 的 例子 中 ，a -=-b 是 
传递 给 函数 abs 的 实 参 : 


if (abs(a - b) > n) 
printf("difference is out of range\n"); 


一 个 函数 如 果 形 参 列表 为 空 ， 在 被 调用 时 实 参 列表 也 为 空 。 例 如 ， 


eatline(): 


任何 一 个 C 函 数 都 有 返回 类 型 ， 要 么 是 void， 要 么 是 函数 生成 结果 的 类 型 。 函 
数 的 返回 类 型 理解 起 来 要 比 参 数 类 型 相对 容易 一 些 ， 因 此 我 们 首先 讨论 它 。 


如 果 任 何 一 个 函数 在 调用 它 的 每 个 文件 中 ， 都 在 第 一 次 被 调用 之 前 进行 了 声 
明 或 定义 ， 那 么 就 不 会 有 任何 与 返回 类 型 相关 的 麻烦 。 例 如 ， 考 虑 下 面 的 例子 ， 
函数 Square 计算 它 的 双 精 度 类 型 参数 的 平方 值 : 


double 
square(double x) 


{ 
return x*x; 
} 
以 及 一 个 调用 square 函 数 的 程序 : 
main() 


printf("%g\n", square(@.3)); 


要 使 这 个 程序 能 够 运行 ， 函 数 square 必 须要 么 在 main 之 前 进行 定义 : 


double 
square(double x) 


{ 


return x*x; 


printf("%g\n", square(@.3)); 


要 么 在 main 之 前 进行 声明 : 


double square(double ; 


main() 

printf("%g\n", square(@.3)); 
} 
double 


square(double x) 


return x*x; 


如 果 一 个 函数 在 被 定义 或 声明 之 前 被 调用 ， 那 么 它 的 返回 类 型 就 默认 为 整 
型 。 上 面 的 例子 中 ， 如 果 将 main 函 数 单独 抽取 出 来 作为 一 个 源 文件 : 


main() 


printf("%g\n", square(@.3)); 


因为 函数 main 假 定 函数 square 的 返回 类 型 为 整 型 ， 而 函数 square 的 返回 类 型 实 
际 上 是 双 精 度 类 型 ， 当 它 与 square 函 数 连 接 时 ， 就 会 得 出 错误 的 结 


如 果 我 们 需要 在 两 个 不 同 的 文件 中 分 别 定义 函数 main 与 函数 square， 那 么 应 
该 如 何 处 理 呢 ? 函数 square 只 能 有 一 个 定义 。 如 果 square 的 调用 与 定义 分 别 位 于 不 
同 的 文件 中 ， 那 么 我 们 必须 在 调用 它 的 文件 中 声明 Square 函数 : 


double square(double) ; 
main() 


printf("%g\n", square(@.3)); 


} 


在 C 语 言 中 ， 形 参与 实 参 匹 配 的 规则 稍微 有 一 点 复杂 。ANSI C 多 许 程序 员 在 
声明 时 指定 函数 的 参数 类 型 : 


double square(double); 


上 面 的 语句 声明 函数 square 接 受 一 个 双 精 度 类 型 的 参数 ， 返 回 一 个 双 精 度 类 
型 的 结果 。 根 据 这 个 声明 ，square(2) 是 合法 的 ;整数 2 将 会 被 自动 转换 为 双 精 度 类 
型 ， 就 好 像 程 序 员 写成 square((double)2) 或 者 square(2.0) 一 样 。 


如 果 一 个 函数 没有 float、short 或 者 char 类 型 的 参数 ， 在 函数 声明 中 完全 可 以 
省 略 参数 类 型 的 说 明 〈 注 意 ， 函 数 定 义 中 不 能 省 略 参 数 类 型 的 说 明 ) 。 因 此 ， 即 
使 是 在 ANSI C 中 ， 像 下 面 这 样 声 明 square 函 数 也 是 可 以 的 : 


double square(); 


RMB Vil FA A BE HE ER H IE A SRA ASRS. eB, “a ast 
不 意味 着 “等 同 ”: float 类 型 的 参数 会 自动 转换 为 double 类 型 ，short 或 char 类 型 的 参 


数 会 自动 转换 为 int 类 型 。 例 如 ， 对 于 下 面 的 函数 : 


int 
isvowel(char c) 


{ 


return c == 'a' || c == 'e' | 


因为 其 形 参 为 char 类 型 ， 所 以 在 调用 该 函数 的 其 他 文件 中 必须 声明 : 


int isvowel(char); 


否则 ， 调 用 方 将 把 传递 给 isvowel 函 数 的 实 参 自动 转换 为 int 类 型 ， 这 样 就 与 形 
参 类 型 不 一 至 了。 如 果 函 数 isvowel 是 这 样 定义 的 : 


int isvowel(int c) { 
return c= 


那么 调用 方 无 须 进行 声明 ， 即 使 调用 方 在 调用 时 传递 给 isvowel 函 数 一 个 char 
类 型 的 参数 ， 也 是 如 此 。 


oo 并 不 都 支持 这 种 风格 的 声明 。 当 使 用 
编译 器 时 ， 我 们 有 必要 像 下 面 这 样 声明 isvowel 函 数 : 


int isvowel(); 


以 及 这 样 定义 它 : 


int isvowel(c) 
char c; 
{ 


return c == 'a' || c == 'e' | 
' ' | ' ' 


为 了 与 早期 的 用 法 兼容 ，ANSI C 也 支持 这 种 较 “ 老 ”形式 的 声明 和 定义 。 这 就 


带 来 一 个 问题 ， 如 果 一 个 文件 中 调用 了 isvowel 函 数 ， 却 又 不 能 声明 它 的 参数 类 型 


(为 了 能 够 在 较 “ 老 * 的 编译 器 上 工作 ) ， 那 么 编译 器 如 何 知道 函数 形 参 是 char 类 


型 而 不 是 int 类 型 的 呢 ? 答案 在 于 ， 新 旧 两 种 不 同 的 函数 定义 形式 代表 不 同 的 含 
义 。 上 面 isvowel 函 数 的 最 后 一 个 定义 ， 实 际 上 相当 于 : 


int 
isvowel(int i) 
{ 
char c = i; 
return c == 'a' || c == 'e' || c == 'i' || 
== "o" || gs “u's 
} 


现在 我 们 已 经 了 解 函数 定义 与 声明 的 有 关 细 节 ， 再 来 看 看 这 方面 容易 出 错 
的 一 些 方式 。 下 面 这 个 程序 虽然 简单 ， 却 不 能 运行 : 


double s; 
s = sqrt(2); 
printf("%g\n", s); 


原因 有 两 个 。 第 一 个 原因 是 ，sqrt 函 数 本 应 接受 一 个 双 精 度 值 为 实 参 ， 而 实 
际 上 却 被 传递 了 一 个 整 型 参数 。 第 二 个 原因 是 ，sqrt 函 数 的 返回 类 型 是 双 精 度 类 


型 ， 但 却 并 没有 这 样 声 明 。 


一 种 更 正方 式 是 : 


double sqrt(double); 


main() 
{ 
double s; 
s = sqrt(2); 
printf("%g\n", s); 
} 


在 用 另 一 种 方式 ， 则 更 正 后 的 程序 可 以 在 ANSI C 标 准 发 布 之 前 就 存在 的 C 纺 
译 器 上 工作 ， 即 : 


double sqrt(); 
main() 
{ 
double s; 
s = sqrt(2.@); 
printf("%g\n", s); 
} 


当然 ， 最 好 的 更 正方 式 是 下 面 这 样 : 


#include <math.h> 


main() 


double s; 
s = sqrt(2.@); 
printf("%g\n", s); 


这 个 程序 看 上 去 并 没有 显 式 地 说 明 sqrt 函 数 的 参数 类 型 与 返回 类 型 ， 但 实际 
上 和 它 从 系统 头 文件 math.h 中 获得 了 这 些 信息 。 尽 管 本 例 为 了 与 早期 C 编 译 器 兼容 ， 
己 经 把 实 参 写 成 了 双 精 度 类 型 的 2.0 而 不 是 整 型 的 2， 然 而 即使 仍然 写作 整 型 的 2， 
在 符合 ANSI C 标 准 的 编译 器 上 ， 这 个 程序 也 能 确保 实 参 会 被 转换 为 恰当 的 类 型 。 


因为 函数 printf 与 函数 scanf 在 不 同情 形 下 可 以 接受 不 同类 型 的 参数 ， 所 以 它们 
特别 容易 出 错 。 这 里 有 一 个 值得 注意 的 例子 : 


#include <stdio.h> 
main() 
{ 
int i; 
char c; 
for (i = ð; i < 5; i++) { 
scanf("%d", &c); 
printf("%d ", i); 


} 
printf("\n"); 


表面 上 ， 这 个 程序 从 标准 输入 设备 读 入 5 个 数 ， 在 标准 输出 设备 上 写 5 个 数 : 
O 1 2 3 4 


实际 上 ， 这 个 程序 并 不 一 定 得 到 上 面 的 结果 。 例 如 ， 在 茶 个 编译 器 上 ， 它 的 


输出 是 


00600001 2 3 4 


为 什么 呢 ? 问题 的 关键 在 于 ， 这 里 c 被 声明 为 char 类 型 ， 而 不 是 int 类 型 。 如 果 
程序 要 求 scanf 读 入 一 个 整数 ， 应 该 传递 给 它 一 个 指向 整数 的 指针 。 而 程序 中 scanf 
函数 得 到 的 却 是 一 个 指向 字符 的 指针 ，scanf 函 数 并 不 能 分 辨 这 种 情况 ， 它 只 是 将 
这 个 指向 字符 的 指针 作为 指向 整数 的 指针 而 接受 ， 并 且 在 指针 指向 的 位 置 存储 一 
个 整数 。 因 为 整数 所 占 的 存储 空间 要 大 于 字符 所 占 的 存储 空间 ， 所 以 字符 c 附 近 的 
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字符 c 附 近 的 内 存 中 存储 的 内 容 是 由 编译 器 决定 的 ， 在 本 例 中 它 存放 的 是 整数 
i 的 低 端 部 分 。 因 此 ， 每 次 读 入 一 个 数值 到 c 时 ， 都 会 将 ij 的 低 端 部 分 履 兰 为 0， 而 i 
的 高 端 部 分 本 来 就 是 0， 相 当 于 ij 每 次 被 重新 设置 为 0， 循 环 将 一 直 进行 。 当 到 达 文 
件 的 结束 位 置 后 ，scanf 函 数 不 再 试图 读 入 新 的 数值 到 c。 这 时 ，i 才 可 以 正常 地 递 


增 ， 最 后 终止 循环 。 


4.5 检查 外 部 类 型 

假定 我 们 有 一 个 C 程 序 ， 它 由 两 个 源 文件 组 成 。 一 个 文件 包含 外 部 变量 n 的 声 
J: 

另 一 个 文件 包含 外 部 变量 n 的 定义 ， 


这 里 假定 两 个 语句 都 不 在 任何 一 个 函数 体内 ， 因 此 n 古 外 部 变量 。 


这 是 一 个 无 效 的 C 程 序 ， 因 为 同一 个 外 部 变量 名 在 两 个 不 同 的 文件 中 被 声明 
为 不 同 的 类 型 。 然 而 ， 大 多 数 C 语 言 实现 却 不 能 检测 出 这 种 错误 。 编 译 器 对 这 两 
个 不 同 的 文件 分 别 进行 处 理 ， 这 两 个 文件 的 编译 时 间 甚 至 可 以 相差 好 几 个 月 。 因 
此 ， 编 译 器 在 编译 一 个 文件 时 ， 并 不 知道 男 一 个 文件 的 内 容 。 链 接 器 可 能 对 C 语 
言 一 无 所 知 ， 因 此 它 也 不 知道 如 何 比较 两 个 n 的 定义 中 的 类 型 。 


当 这 个 程序 运行 时 ， 完 竟 会 发 生 什 么 情况 呢 ? 存在 很 多 的 可 能 情况 。 


1. C 语 言 编译 器 足够 “聪明 ”， 能 够 检测 到 这 一 类 型 的 冲突 。 编 程 人 员 将 会 得 
到 一 条 诊断 消息 ， 报 告 变 量 n 在 两 个 不 同 的 文件 中 被 给 定 了 不 同 的 类 型 。 


2. 读者 使 用 的 C 语 言 实现 对 int 类 型 的 数值 与 long 类 型 的 数值 在 内 部 表示 上 古 
一 样 的 。 尤 其 是 在 32 位 计算 机 上 ， 一 般 都 是 如 此 处 理 。 在 这 种 情况 下 ， 程 序 很 可 
能 正常 工作 ， 就 好 像 n 在 两 个 文件 中 都 被 声明 为 long (或 int〉 类 型 一 样 。 本 来 错误 
的 程序 因为 茶 种 巧合 却 能 够 工作 ， 这 是 一 个 很 好 的 例子 。 


3. 变量 n 的 两 个 实例 虽然 要 求 的 存储 空间 的 大 小 不 同 ， 但 是 它们 共享 存储 空 
间 的 方式 却 恰好 能 够 满足 这 样 的 条 件 : 赋 给 其 中 一 个 的 值 ， 对 另 一 个 也 是 有 效 


的 。 这 是 有 可 能 发 生 的 。 举 例 来 说 ， 如 果 链 接 器 安排 int 类 型 的 n 与 long 类 型 的 np 的 
低 端 部 分 共享 存储 空间 ， 这 样 给 每 个 long 类 型 的 n 赋 值 ， 恰 好 相当 于 把 其 低 端 部 分 
赋 给 Jint 类 型 的 n。 本 来 错误 的 程序 因为 茶 种 巧合 却 能 够 工作 ， 这 是 一 个 比 第 2 种 
情况 更 能 说 明 问 题 的 例子 。 


4. 变量 n 的 两 个 实例 共享 存储 空间 的 方式 ， 使 得 对 其 中 一 个 赋值 时 ， 其 效果 
相当 于 同时 给 男 一 个 赋 了 完全 不 同 的 值 。 在 这 种 情况 下 ， 程 序 将 不 能 正常 工作 。 


因此 ， 保 证 一 个 特定 名 称 的 所 有 外 部 定义 在 每 个 目标 模块 中 都 有 相同 的 类 
型 ， 一 般 来 说 是 程序 员 的 责任 。 而 且 , “相同 的 类 型 "也 应 该 是 严格 意义 上 的 相 
同 。 例 如 ， 考 虑 下 面 的 程序 ， 在 一 个 文件 中 包含 定义 : 


char filename[] = "/etc/passwd"; 


而 在 男 一 个 文件 中 包含 声明 : 


extern char* filename; 


尽管 在 某 些 上 下 文 环 境 中 ， 数 组 与 指针 非常 类 似 ， 但 它们 毕竟 不 同 。 在 第 一 
个 声明 中 ， 和 名 ename 是 一 个 字符 数组 的 名 称 。 尽 管 在 一 个 语句 中 引用 名 ename 的 值 
将 得 到 指向 该 数组 起 始 元 素 的 指针 ， 但 是 flename 的 类 型 是 “字符 数组 ”， 而 不 
是 “字符 指针 ”。 在 第 二 个 声明 中 ， 人 ename 被 确定 为 一 个 指针 。 这 两 个 对 flename 
的 声明 使 用 存储 空间 的 方式 是 不 同 的 ， 它 们 无 法 以 一 种 合乎 情理 的 方式 共存 。 第 
一 个 例子 中 字符 数组 多 ename 的 内 存 布局 大 致 如 图 4-1 所 示 。 


filename 


图 4-1 字符 数组 flename 的 内 存 布局 示意 图 


第 二 个 例子 中 字符 指针 fename 的 内 存 布局 大 致 如 图 4-2 所 示 。 


filename 


图 4-2 ”字符 指针 f 旬 ename 的 内 存 布 局 示意 图 


要 更 正本 例 ， 应 该 改变 人 iename 的 声明 或 定义 中 的 一 个 ， 使 其 与 男 一 个 类 型 
匹配 。 因 此 ， 既 可 以 是 如 下 改 法 : 


char filename[] = "/etc/passwd"; /* 文件 1 */ 
extern char filename[]; /* 文件 2 */ 


也 可 以 是 这 种 改 法 : 


char* filename = "/etc/passwd"; /* 文件 1 */ 
extern char* filename; /* 文件 2 */ 


有 关外 部 类 型 方面 男 一 种 容易 带 来 兵 烦 的 方式 是 ， 忽 略 了 声明 函数 的 返回 类 
型 ， 或 者 声明 了 错误 的 返回 类 型 。 例 如 ， 回 顾 一 下 4.4 节 中 讨论 的 程序 : 


double s; 
s = sqrt(2); 
printf("%g\n", s); 


这 个 程序 没有 包括 对 函数 sqrt 的 声明 ， 因 而 函数 sqrt 的 返回 类 型 只 能 从 上 下 文 
进行 推断 。C 语 言 中 的 规则 是 ， 如 果 一 个 未 声明 的 标识 符 后 跟 一 个 开 括 号 ， 那 么 
它 将 被 视 为 一 个 返回 整 型 的 函数 。 因 此 ， 这 个 程序 完全 等 同 于 下 面 的 程序 : 


extern int sqrt(); 
main() 
double s; 


s = sqrt(2); 
printf("%g\n", s); 


当然 ， 这 种 写法 是 错误 的 。 函 数 sqrt 返 回 双 精度 类 型 ， 而 不 是 整 型 。 因 此 ， 
这 个 程序 的 结果 是 不 可 预测 的 。 事 实 上 ， 该 程序 似乎 能 够 在 某 些 机 器 上 工作 。 举 
例 来 次， 假定 有 这 样 一 种 机 器 ， 无 论 函 数 的 返回 值 是 整 型 值 还 是 浮 点 值 ， 它 都 使 
用 同样 的 寄存 器 。 这 样 的 机 器 将 直接 把 函数 sqrt 的 返回 结果 按 其 二 进 制 表 示 的 各 
个 位 传递 给 函数 printf， 而 并 不 去 检查 类 型 是 否 一 致 。 函 数 printf 得 到 了 正确 的 二 进 
制 表 示 ， 当 然 能 够 打印 出 正确 的 结果 。 茶 些 机 器 在 不 同 的 寄存 器 中 存储 整数 与 指 
针 。 在 这 样 的 机 器 上 ， 即 使 不 牵涉 序 点 运算 ， 这 种 类 型 的 错误 也 仍然 可 能 造成 程 
序 失败 。 
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有 一 个 好 方法 可 以 避免 大 部 分 上 述 问 题 ， 这 个 方法 只 需要 我 们 接受 一 个 简单 
的 规则 : 每 个 外 部 对 象 只 在 一 个 地 方 声 明 。 这 个 声明 的 地 方 一 般 就 在 头 文件 中 ， 
需要 用 到 该 外 部 对 象 的 所 有 模块 都 应 该 包括 这 个 头 文件 。 特 别 需要 指出 的 是 ， 定 
义 该 外 部 对 象 的 模块 也 应 该 包括 这 个 头 文 件 。 


例如 ， 再 来 看 前 面 讨论 过 的 身 ename 例 子 。 这 个 例子 可 能 是 一 个 完整 程序 的 
一 部 分 ， 该 程序 由 多 个 模块 组 成 ， 每 个 模块 都 需要 知道 一 个 特定 文件 名 。 我 们 和 希 
望 能 够 做 到 只 在 一 处 改动 这 个 特定 的 文件 名 ， 所 有 模块 中 的 文件 名 就 同时 得 到 更 
新 。 我 们 可 以 这 样 来 做 ， 即 创建 一 个 文件 ， 比 如 和 ie.h， 它 包含 了 声明 : 


extern char filename[]; 


在 需要 用 到 外 部 对 象 人 ename 的 每 个 C 源 文件 中 ， 都 应 该 加 上 这 样 一 个 语句 : 


#include "file.h" 


最 后 ， 我 们 选择 一 个 C 源 文件 ， 在 其 中 给 出 flename 的 初始 值 。 不 妨 称 这 个 文 
件 为 file.c: 


#include "file.h" 
char filename[] = "/etc/passwd"; 


注意 ， 源 文件 file.c 实 际 上 包含 位 ename 的 两 个 声明 ， 只 要 把 include 语 句 展 开 
就 可 以 看 出 这 一 点: 


extern char filename[]; 
char filename[] = "/etc/passwd"; 


只 要 源 文件 名 e.c 中 filename 的 各 个 声明 是 一 致 的 ， 而 且 这 些 声明 中 最 多 只 有 
一 个 是 旨 ename 的 定义 ， 这 样 写 就 是 合法 的 。 


让 我 们 来 看 这 样 做 的 效果 。 头 文件 fle.h 中 声明 了 filename 的 类 型 ， 因 此 每 个 
包含 了 fle.h 的 模块 也 就 自动 地 正确 声明 了 filename 的 类 型 。 源 文件 file.c 定 义 了 
filename， 由 于 它 也 包含 了 季 e.h 头 文件 ， 因 此 filename 定 义 的 类 型 自动 与 声明 的 类 
型 相符 合 。 如 果 编 译 所 有 这 些 文件 ， 人 lename 的 类 型 就 肯定 是 正确 的 ! 


练习 4-1 假定 一 个 程序 在 一 个 源 文件 中 包含 了 声明 : 


long foo; 


而 在 男 一 个 源 文件 中 包含 了 : 


extern short foo; 


又 进一步 假定 ， 如 果 给 long 类 型 的 foo 赋 一 个 较 小 的 值 ， 例 如 37， 那 么 short 类 
型 的 foo 就 同时 获得 了 一 个 值 37。 我 们 能 够 对 运行 该 程序 的 硬件 做 出 什么 样 的 推 
Wr? 如 果 short 类 型 的 foo 得 到 的 值 不 是 37 而 是 0， 我 们 又 能 够 做 出 什么 样 的 推断 ? 


练习 4-2 4.4 节 中 讨论 的 错误 程序 ， 经 过 适当 简化 后 如 下 所 示 : 


#include <stdio.h> 


main() 


printf("%g\n", sqrt(2)); 
} 


在 某 些 系统 中 ， 打 印 出 的 结果 是 


%g 


请 问 这 是 为 什么 ? 
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C 语 言 中 没有 定义 输入 /输出 语句 ， 任 何 一 个 有 用 的 C 程 序 〈 起 码 必 须 接受 零 
个 或 多 个 输入 ， 生 成 一 个 或 多 个 输出 ) 都 必须 调用 库 函 数 来 完成 最 基本 的 输入 /和 输 
出 操作 。ANSI C 标 准 毫 无 疑问 地 意识 到 了 这 一 点 ， 因 而 定义 了 一 个 包含 大 量 标准 
库 函 数 的 集合 。 从 理论 上 说 ， 任 何 一 个 C 语 言 实现 都 应 该 提供 这 些 标准 库 函 数 。 
ANSI C 中 定义 的 标准 库 函 数 集合 并 不 完备 。 例 如 ， 基 本 上 所 有 的 C 语 言 实现 都 包 
括 了 执行 “底层 ”TO 操作 的 read 和 write 函数 ， 但 是 这 些 函数 却 并 没有 出 现在 ANSI C 
标准 中 。 除 此 之 外 ， 并 非 所 有 的 C 语 言 实 现 都 包括 了 全 部 的 标准 库 函 数 。 毕 竟 ， 
ANSI C 标 准 还 是 一 个 新 生 事物 。 


译注 : 


根据 序言 中 的 说 明 ， 作 者 写作 本 书 时 ANSI C 标 准 尚 没有 最 后 定案 。 


大 多 数 库 函 数 的 使 用 都 不 会 有 什么 腑 烦 ， 它 们 的 意义 和 用 法 明白 而 直接 ， 程 
序 员 大 部 分 时 间 似 乎 都 能 够 正确 地 使 用 它们 。 然 而 ， 也 有 一 些 例外 情形 ， 如 某 些 
经 常用 到 的 库 函 数 表现 出 来 的 行为 方式 往往 有 那 于 使 用 者 的 本 意 。 特 别 是 ， 程 序 
员 似 乎 常常 对 printf 函 数 族 ， 以 及 varargs.h (用 于 编写 具有 可 变 参 数列 表 的 函数 ) 
的 诸多 细节 感到 环 手 。 本 书 附 录 中 详细 说 明了 这 两 个 工具 ， 以 及 stdarg.h (ANSIC 
版 本 的 varargs.h) 工具 。 


有 关 库 函数 的 使 用 ， 我 们 能 给 出 的 最 好 建议 是 尽量 使 用 系统 头 文件 。 如 果 库 
文件 的 作者 已 经 提供 了 精确 描述 库 函 数 的 头 文件 ， 不 去 使 用 它们 就 真是 思 不 可 


及 。 在 ANSI C 中 这 一 点 尤其 重要 ， 因 为 头 文件 中 包括 了 库 函 数 的 参数 类 型 以 及 返 
回 类 型 的 声明 。 事 实 上 ， 茶 些 情况 下 为 了 保证 得 到 正确 的 结果 ，ANSI C 标 准 甚至 
强制 要 求 使 用 系统 头 文 件 。 


本 章 将 探讨 茶 些 第 见 的 库 函 数 ， 以 及 编程 人 员 在 使 用 它们 的 过 程 中 可 能 出 错 
Zhe 


5.1 返回 整数 的 getchar 函 数 


我 们 首先 考虑 下 面 的 例子 : 


#include <stdio.h> 


main() 


{ 


char c; 


while ((c = getchar()) != EOF) 
putchar (c); 


getchar 函 数 在 一 般 情 况 下 返回 的 是 标准 输入 文件 中 的 下 一 个 字符 ， 当 没有 输 
入 时 ， 返 回 EOF《〈 一 个 在 头 文件 stdio.h 中 定义 的 值 ， 不 同 于 任何 一 个 字符 ) 。 这 
个 程序 乍 一 看 似乎 是 把 标准 输入 复制 到 标准 输出 ， 实 则 不 然 。 


原因 在 于 程序 中 的 变量 c 被 声明 为 char 类 型 ， 而 不 是 int 类 型 。 这 意味 着 c 无 法 
容 下 所 有 可 能 的 字符 ， 特 别 是 可 能 无 法 容 下 EOF。 


因此 ， 最 终结 果 存 在 两 种 可 能 ;一 种 可 能 是 ， 茶 些 合法 的 输入 字符 在 被 “ 截 
条 ?后 使 得 c 的 取 值 与 ECOF 相 同 ， 另 一 种 可 能 是 ，c 根 本 不 可 能 取 到 EOF 这 个 值 。 对 
于 前 一 种 情况 ， 程 序 将 在 文件 复制 的 中 途 终止 ， 对 于 后 一 种 情况 ， 程 序 将 陷入 一 
个 死 循环 。 


实际 上 ， 还 有 可 能 存在 第 三 种 情况 : 程序 表面 上 似乎 能 够 正常 工作 ， 但 完全 
是 因为 巧合 。 尽 管 函 数 getchar 的 返回 结果 在 赋 给 char 类 型 的 变量 c 时 会 发 生 “ 截 
叶 ” 操 作 ， 尺 管 while 语 句 中 比较 运算 的 操作 数 不 是 函数 getchar 的 返回 值 ， 而 是 
被 “截断 ”的 值 c， 但 令 人 惊讶 的 是 许多 编译 器 对 上 述 表 达 式 的 实现 并 不 正确 。 这 些 
编译 器 确实 对 函数 getchar 的 返回 值 做 了 “截断” 处理， 并 把 低 端 字 节 部 分 赋 给 了 变 
量 c。 但 是 ， 它 们 在 比较 表达 式 中 并 不 是 比较 < 与 ECOF， 而 是 比较 getchar 函 数 的 返 
回 值 与 EOF! 编译 器 如 果 采 取 的 是 这 种 做 法 ， 上 面 的 例子 程序 看 上 去 就 能 够 “ 正 


5.2 更 新 顺序 文件 


许多 系统 中 的 标准 输入 /和 输出 库 都 允许 程序 打开 一 个 文件 ， 同 时 进行 号 入 和 读 
出 的 操作 : 


FILE *fp; 
fp = fopen(file, "r+"); 


上 面 的 例子 代码 打开 了 文件 名 由 变量 名 e 指 定 的 文件 ， 对 于 存 取 权 限 的 设 定 表 
明 程 序 希 望 对 这 个 文件 进行 输入 和 输出 操作 。 

编程 人 员 也 许 认 为 ， 程 序 一 旦 执行 完 上 述 操作 ， 就 可 以 自由 地 交错 进行 读 出 
和 写 入 的 操作 。 遗 憾 的 是 ， 事 实 总 难 遂 人 所 愿 ， 为 了 保持 与 过 去 不 能 同时 进行 读 
写 操作 的 程序 的 癌 下 兼容 性 ， 一 个 输入 操作 不 能 随后 直接 紧 跟 一 个 输出 操作 ， 反 
之 亦 然 。 如 果 要 同时 进行 输入 和 输出 操作 ， 必 须 在 其 中 插入 fseek 函 数 的 调用 。 


下 面 的 程序 片段 似乎 更 新 了 一 个 顺序 文件 中 选 定 的 记录 : 


FILE *fp; 
struct record rec; 


while (fread( (char *)&rec, sizeof(rec), 1, fp) == 1) { 
/* 对 rec 执 行 某 些 操 作 */ 
if (/* rec 必 须 被 重新 写 入 */) { 
fseek(fp, -(long)sizeof(rec), 1); 
fwrite( (char *)&rec, sizeof(rec), 1, fp); 


} 


这 段 代码 乍 看 上 去 佬 无 问题 : &rec 在 传 入 fread 和 fwrite 函 数 时 被 小 心 辟 避 地 转 
换 为 字符 指针 类 型 ，sizeof(rec) 被 转换 为 长 整 型 (fseek 函 数 要 求 第 二 个 参数 是 long 
类 型 ， 因 为 int 类 型 的 整数 可 能 无 法 包含 一 个 文件 的 大 小 ;sizeof 返 回 一 个 unsigned 


值 ， 因 此 首先 必须 将 其 转换 为 有 符号 类 型 才 有 可 能 将 其 反 号 ) 。 但 是 这 段 代码 仍 
然 可 能 运行 失败 ， 而 且 出 错 的 方式 非常 难于 察觉 。 


问题 出 在 : 如 果 一 个 记录 需要 被 重新 写 入 文件 ， 也 就 是 说 ， 如 果 执 行 了 fwrite 
函数 ， 对 这 个 文件 执行 的 下 一 个 操作 将 是 执行 循环 开始 处 的 fread 函 数 。 因 为 在 
fwrite 函 数 调用 与 fread 函 数 调用 之 间 缺 少 了 一 个 fseek 函 数 调 用 ， 所 以 无 法 进行 上 
述 操作 。 解 决 的 办 法 是 把 这 段 代 码 改写 为 : 


while (fread( (char *)&rec, sizeof(rec), 1, fp) == 1) { 
/* 对 rec 执 行 某 些 操作 */ 


if (/* rec 必 须 被 重新 写 入 */) { 
fseek(fp, -(long)sizeof(rec), 1); 
fwrite( (char *)&rec, sizeof(rec), 1, fp); 
fseek(fp, OL, 1); 

} 


第 二 个 fseek 函 数 虽 然 看 上 去 什么 也 没 做 ， 但 它 改变 了 文件 的 状态 ， 使 得 文件 
现在 可 以 正常 地 进行 读 取 了 了。 


5.3 ” 绥 冲 输出 与 内 存 分 配 


当 一 个 程序 生成 输出 时 ， 是 否 有 必要 将 输出 立即 展示 给 用 户 ? 这 个 问题 的 答 
案 根 据 不 同 的 程序 而 定 。 


例如 ， 假 设 一 个 程序 输出 到 终端 ， 同 终端 前 的 用 户 提问 ， 要 求 用 户 回 答 ， 那 
么 为 了 让 用 户 知道 应 该 输入 什么 内 容 ， 程 序 输出 应 该 即时 地 显示 给 用 户 。 男 一 种 
情况 是 ， 假 设 一 个 程序 输出 到 一 个 文件 ， 然 后 输出 到 一 个 行 式 打 印 机 ， 那 么 只 要 
程序 结果 最 后 都 全 部 输出 到 了 目标 《文件 或 打印 机 ) 就 可 以 了 。 


程序 输出 有 两 种 方式 : 一 种 是 即时 处 理 方式 ， 另 一 种 是 先 暂 存 起 来 ， 然 后 再 
大 块 写 入 的 方式 。 前 者 往往 造成 较 高 的 系统 负担 。 因 此 ，C 语 言 实现 通常 都 允许 
程序 员 在 进行 实际 的 写 操 作 之 前 控制 产生 的 输出 数据 量 。 


这 种 控制 能 力 一 般 是 通过 库 函 数 setbuf 实 现 的 。 如 果 buf 是 一 个 大 小 适当 的 字 
符 数 组 ， 那 么 


setbuf(stdout, buf); 


语句 将 通知 输入 /输出 库 ， 所 有 写 入 stdout 的 输出 都 应 该 使 用 buf 作 为 输出 缓冲 
区 ， 直 到 buf 缓 冲 区 被 填 满 或 者 程序 员 直 接 调用 乌 ush《〈 译 注 : 对 于 由 写 操作 打开 
的 文件 ， 调 用 fush 将 导致 输出 缓冲 区 的 内 容 被 实际 地 写 入 该 文件 ) ，buf 缓 冲 区 
中 的 内 容 才 实际 写 入 stdout 中 。 缓 冲 区 的 大 小 由 系统 头 文 件 <stdio.h> 中 的 BUFSIZ 
定义 。 


下 面 的 程序 的 作用 是 把 标准 输入 的 内 容 复 制 到 标准 输出 中 ， 它 演示 了 setbuf 库 
函数 最 显而易见 的 用 法 : 


#include <stdio.h> 


main() 


int c; 


char buf[BUFSIZ]; 
setbuf (stdout, buf); 


while ((c = getchar()) != EOF) 
putchar(c); 


遗憾 的 是 ， 这 个 程序 是 错误 的 ， 仅 仅 是 因为 一 个 细微 的 原因 。 程 序 中 对 库 函 
数 setbuf 的 调用 ， 通 知 了 输入 /输出 库 所 有 字符 的 标准 输出 应 该 首先 缓存 在 buf 中 。 
要 找到 问题 出 自 何 处 ， 我 们 不 妨 思考 一 人 buf 缓冲 区 最 后 一 次 被 清空 是 在 什么 时 
候 ? 答案 是 在 main 函 数 结束 之 后 ， 在 将 控制 权 交 回 给 操作 系统 之 前 ，C 运 行 时 库 
所 必须 进行 的 清理 工作 的 一 部 分 。 但 是 ， 在 此 之 前 buf 字 符 数 组 己 经 被 释放 ! 


有 两 种 方法 可 以 用 来 避免 这 种 类 型 的 错误 。 第 一 种 办 法 是 让 缓冲 数组 成 为 静 
态 数组 ， 既 可 以 直接 显 式 声 明 buf 为 静态 : 


static char buf[BUFSIZ] ; 


也 可 以 把 buf 声 明 完全 移 到 main 函 数 之 外 。 第 二 种 办 法 是 动态 分 配 缓冲 区 ， 在 
程序 中 并 不 主动 释放 分 配 的 缓冲 区 (由 于 缓冲 区 是 动态 分 配 的 ， 因 此 main 函 数 结 
束 时 并 不 会 释放 该 缓冲 区 ， 这 样 C 运 行 时 库 在 进行 清理 工作 时 就 不 会 发 生 缓冲 区 
己 释 放 的 情况 ) : 


char *malloc(); 
setbuf(stdout, malloc(BUFSIZ)); 

如 果 读 者 关心 一 些 编程 “小 技巧 ”也 许 会 注意 到 这 里 其 实 并 不 需要 检查 
malloc 函 数 调用 是 否 成 功 。 如 果 malloc 函 数 调用 失败 ， 将 返回 一 个 null 指 针 。setbuf 
函数 的 第 二 个 参数 取 值 可 以 为 hol， 此 时 标准 输出 不 需要 进行 缓冲 。 在 这 种 情况 
下 ， 程 序 仍然 能 够 工作 ， 只 不 过 速度 较 慢 而 已 。 


5.4 ”使 用 errno 检 测 错 误 


很 多 库 函 数 ， 特 别 是 那些 与 操作 系统 有 关 的 库 函 数 ， 当 执行 失败 时 会 通过 一 
个 名 称 为 errmmo 的 外 部 变量 ， 通 知 程序 该 函数 调用 失败 。 下 面 的 代码 利用 这 一 特性 
进行 错误 处 理 ， 似 乎 再 清楚 明日 不 过 ， 然 而 却 是 错误 的 : 


/* 调用 库 函 数 */ 


if (errno) 


/* 处 理 错误 */ 


出 错 的 原因 在 于 ， 在 库 函 数 调用 没有 失败 的 情况 下 ， 并 没有 强制 要 求 库 函 数 
一 定 要 设置 errno 为 0， 这 样 ermo 的 值 就 可 能 是 前 一 个 执行 失败 的 库 函 数 设置 的 
值 。 下 面 的 代码 做 了 更 正 ， 似 乎 能 够 工作 ， 但 可 惜 还 是 错误 的 : 


errno = ð; 
/* 调用 库 函 数 */ 


if (errno) 


/* 处 理 错误 */ 


库 函 数 在 调用 成 功 时 ， 既 没有 强制 要 求 对 ermo 清 零 ， 同 时 也 没有 禁止 设置 
errmo。 既 然 库 函数 已 经 调用 成 功 ， 为 什么 还 有 可 能 设置 ermo 呢 ?要 理解 这 一 点 ， 
我 们 不 妨 假想 一 下 库 函 数 fopen 在 调用 时 可 能 会 发 生 什 么 情况 。 当 fopen 函 数 被 要 
求 新 建 一 个 文件 以 供 程序 输出 时 ， 如 果 已 经 存在 一 个 同名 文件 ，fopen 函 数 将 先 删 
除 它 ， 然 后 新 建 一 个 文件 。 这 样 ，fopen 函 数 可 能 需要 调用 其 他 的 库 函 数 ， 以 检测 
同名 文件 是 否 已 经 存在 《假设 用 于 检测 文件 的 库 函 数 在 文件 不 存在 时 ， 会 设置 
ermo。 那 么 ，fopen 函 数 每 次 新 建 一 个 事先 并 不 存在 的 文件 时 ， 即 使 没有 任何 程序 
错误 发 生 ， 也 仍然 可 能 设置 ermo) 。 


因此 ， 在 调用 库 函 数 时 ， 我 们 应 该 首先 检测 作为 错误 指示 的 返回 值 ， 确 定 程 
序 执行 已 经 失败 ， 然 后 再 检查 errno， 来 搞 清 楚 出 错 原因 : 


/* 调用 库 函 数 */ 
if (返回 的 错误 值 ) 


5.5 库 函 数 signal 


实际 上 所 有 的 C 语 言 实现 中 都 包括 signal 库 函数 ， 将 其 作为 捕获 异步 事件 的 一 
种 方式 。 要 使 用 该 库 函 数 ， 需 要 在 源 文件 中 加 上 


#include <signal.h> 


以 引入 相关 的 声明 。 要 处 理 一 个 特定 的 signal《〈 信 号 ) ， 可 以 这 样 调用 signal 
函数 : 


signal(signal type, handler function) ; 


这 里 的 signal type 代 表 系 统 头 文 件 signal.h 中 定义 的 某 些 常量 ， 这 些 常 量 用 来 
标识 signal 函 数 将 要 捕获 的 信号 类 型 。 这 里 的 handler function 是 当 指 定 的 事件 发 生 
时 ， 将 要 加 以 调用 的 事件 处 理 函 数 。 


在 许多 C 语 言 实 现 中 ， 信 号 是 真正 意义 上 的 “异步 "。 从 理论 上 说 ， 一 个 信和 号 
可 能 在 C 程 序 执行 期 间 的 任何 时 刻 发 生 。 需 要 特别 强调 的 是 ， 信 和 号 甚至 可 能 出 现 
在 茶 些 复杂 库 函 数 〈 如 malloc) 的 执行 过 程 中 。 因 此 ， 从 安全 的 角度 考虑 ， 信 和 号 
的 处 理 函 数 不 应 该 调用 上 述 类 型 的 库 函 数 。 


例如 ， 假 设 malloc 函 数 的 执行 过 程 被 一 个 信号 中 断 。 此 时 ，malloc 函 数 用 来 跟 
踪 可 用 内 存 的 数据 结构 很 可 能 只 有 部 分 被 更 新 。 如 果 signal 处 理沙 数 再 调用 malloc 
函数 ， 结 果 可 能 是 malloc 函 数 用 到 的 数据 结构 完全 朋 涡 ， 后 果 不 堪 设想 ! 


基于 同样 的 原因 ， 从 signal 处 理 函 数 中 使 用 longjmp 退 出 ， 通 常情 况 下 也 是 不 
安全 的 : 因为 信号 可 能 发 生 在 malloc 或 者 其 他 库 函 数 开始 更 新 某 个 数据 结构 ， 但 
又 没有 最 后 完成 的 过 程 中 。 因 此 ，signal 处 理 函 数 能 够 做 的 安全 的 事情 ， 似 乎 就 只 
有 设置 一 个 标志 然后 返回 ， 期 待 以 后 主 程序 能 够 检查 到 这 个 标志 ， 发 现 一 个 信号 
己 经 发 生 。 


然而 ， 就 算 这 样 做 也 并 不 总 是 安全 的 。 当 一 个 算术 运算 错误 〈 例 如 溢出 或 者 
零 作 除数 ) 引发 一 个 信号 时 ， 某 些 机 器 在 signal 处 理 函 数 返 回 后 还 将 重新 执行 失败 
的 操作 。 而 当 这 个 算术 运算 重新 执行 时 ， 我 们 并 没有 一 个 可 移植 的 办 法 来 改变 操 
作 数 。 在 这 种 情况 下 ， 最 可 能 的 结果 就 是 马上 又 引发 一 个 同样 的 信号 。 因 此 ， 对 
于 算术 运算 错误 ，signal 处 理 函 数 的 唯一 安全 、 可 移植 的 操作 就 是 打印 一 条 出 错 消 
息 ， 然 后 使 用 longjmp 或 exit 立 即 退出 程序 。 


由 此 ， 我 们 得 到 的 结论 是 : 信号 非常 复杂 环 手 ， 而 且 具 有 一 些 从 本 质 上 而 言 
不 可 移植 的 特性 。 要 解决 这 个 问题 ， 我 们 最 好 采取 “ 守 势 "， 让 signal 处 理 函数 尽 可 


能 简单 ， 并 将 它们 组 织 在 一 起 。 这 样 ， 当 需要 适应 一 个 新 系统 时 ， 我 们 可 以 很 容 
易 地 进行 修改 。 


练习 5-1 当 一 个 程序 异常 终止 时 ， 程 序 输出 的 最 后 几 行 常常 会 丢失 ， 原 因 是 
什么 ? 我 们 能 够 采取 怎样 的 措施 来 解决 这 个 问题 ? 


练习 5-2 ”下面 程序 的 作用 是 把 它 的 输入 复制 到 输出 : 


#include <stdio.h> 
main() 
{ 


register int c; 


while ((c = getchar()) != EOF) 
putchar(c); 


从 这 个 程序 中 去 掉 贡 nclude 语 句 ， 将 导致 程序 不 能 通过 编译 ， 因 为 这 时 EOF 是 
未 定义 的 。 假 定 我 们 手工 定义 了 EOF 〈 当 然 ， 这 是 一 种 不 好 的 做 法 ) : 


#define EOF -1 
main() 
{ 


register int c; 


while ((c = getchar()) != EOF) 
putchar(c); 


这 个 程序 在 许多 系统 中 仍然 能 够 运行 ， 但 是 在 某 些 系统 运行 起 来 却 慢 得 多 。 
这 是 为 什么 ? 


第 6 章 ” 预 处 理 器 


在 严格 意义 上 的 编译 过 程 开始 之 前 ，C 语 言 预 处 理 器 首先 对 程序 代码 做 了 必 
要 的 转换 处 理 。 因 此 ， 我 们 运行 的 程序 实际 上 并 不 是 我 们 所 写 的 程序 。 预 处 理 器 
使 得 编程 人 员 可 以 简化 茶 些 工作 ， 它 的 重要 性 可 以 用 两 个 主要 的 原因 说 明 〈 当 然 
还 有 一 些 次 要 原因 ， 此 处 就 不 葡 述 了 ) 。 


第 一 个 原因 是 ， 我 们 也 许 会 遇 到 这 样 的 情况 ， 即 需要 将 某 个 特定 数量 〈 例 
如 ， 某 个 数据 表 的 大 小 ) 在 程序 中 出 现 的 所 有 实例 统统 加 以 修改 。 我 们 希望 能 够 
通过 在 程序 中 只 改动 一 处 数值 ， 然 后 重新 编译 就 可 以 实现 。 预 处 理 器 要 做 到 这 一 
点 可 以 说 是 轻而易举 ， 即 使 这 个 数值 在 程序 中 的 很 多 地 方 出 现 。 我 们 只 需要 将 这 
个 数值 定义 为 一 个 显 式 常 量 (manifest constant) ， 然 后 在 程序 中 需要 的 地 方 使 用 
这 个 常量 即 可 。 而 且 ， 预 处 理 器 还 能 够 很 容易 地 把 所 有 常量 定义 都 集中 在 一 起 ， 
这 样 也 可 以 轻松 找到 这 些 常量 。 


第 二 个 原因 是 ， 大 多 数 C 语 言 实 现在 函数 调用 时 都 会 带 来 重大 的 系统 开销 。 
因此 ， 我 们 也 许 希 望 有 这 样 一 种 程序 块 ， 即 它 看 上 去 像 一 个 函数 ， 但 却 没有 函数 
调用 的 开销 。 举 例 来 说 ，getchar 和 putchar 经 常 被 实现 为 宏 ， 以 避免 在 每 次 执行 输 
入 或 者 输出 一 个 字符 这 样 简单 的 操作 时 ， 都 要 调用 相应 的 函数 从 而 造成 系统 效率 
的 下 降 。 


虽然 宏 非 常 有 用 ， 但 如 果 程 序 员 没有 认识 到 宏 只 是 对 程序 的 文本 起 作用 ， 那 
么 他 们 很 容易 对 宏 的 作用 感到 迷惑 。 也 就 是 说 ， 宏 提供 了 一 种 对 组 成 C 程 序 的 字 
符 进 行 变换 的 方式 ， 而 并 不 作用 于 程序 中 的 对 象 。 因 而 ， 宏 既 可 以 使 一 段 看 上 去 
完全 不 合 语法 的 代码 成 为 一 个 有 效 的 C 程 序 ， 也 能 使 一 段 看 上 去 无 害 的 代码 成 为 
一 个 可 怕 的 怪物 。 


6.1 不 能 忽视 宏 定义 中 的 空格 


一 个 函数 如 果 不 带 参 数 ， 在 调用 时 只 需 在 函数 名 后 加 上 一 对 括号 即 可 加 以 调 
用 了 。 而 一 个 宏 如 果 不 带 参数 ， 则 只 需要 使 用 宏 名 即 可 ， 插 号 无 关 紧 要 。 只 要 宏 
已经 定义 过 了 ， 就 不 会 带 来 什么 问题 ， 预 处 理 器 从 宏 定义 中 就 可 以 知道 宏 调 用 时 

否 需要 参数 。 


与 宏 调 用 相 比 ， 宏 定义 显得 有 些 “ 上 暗藏 机 关 ”。 例 如 ， 下 面 的 宏 定 义 中 f 是 否 禹 
了 一 个 参数 呢 ? 


#define f (x) ((x)-1) 


答案 只 可 能 有 两 种 : f(x) 或 者 代表 

kov | 
或 者 代表 

(x) ((x)-1) 


在 上 述 宏 定 义 中 ， 第 二 个 答案 是 正确 的 ， 因 为 在 f 和 后 面 的 (x) 之 间 多 了 一 
个 空格 ! 所 以 ， 如 果 希 望 定义 f(x) 为 (CO -1)， 必 须 像 下 面 这 样 写 : 


#define f(x) ((x)-1) 


一 规则 不 适用 于 宏 调 用 ， 而 只 适用 于 宏 定 义 。 因 此 ， 在 上 面 完 成 宏 定 义 
后 ， nt (3) 求 值 后 都 等 于 2。 


6.2 宏 并 不 是 函数 


因为 宏 从 表面 上 看 其 行为 与 函数 非常 相似 ， 程 序 员 有 时 会 禁不住 把 两 者 视 为 
完全 等 同 。 因 此 ， 我 们 常常 可 以 看 到 类 似 下 面 的 写法 : 
#define abs(x) (((x)>=0)?(x):-(x)) 


或 者 


#define max(a,b) ((a)>(b)?(a):(b)) 
请 注意 宏 定义 中 出 现 的 所 有 这 些 括 号 ， 它 们 的 作用 是 预防 引起 与 优先 级 有 关 
的 问题 。 例 如 ， 假 设 宏 abs 被 定义 成 了 这 个 样子 : 


#define abs(x) x>@?x:-x 


让 我 们 来 看 abs(a-b) 求 值 后 会 得 到 怎样 的 结果 。 表 达 式 


abs(a-b) 


会 被 展开 为 


a-b>@?a-b:-a-b 

这 里 的 子 表达 式 -a-b 相 当 于 (-a)-b， 而 不 是 我 们 期 望 的 -(a-b)， 因 此 上 式 无 疑 会 
得 到 一 个 错误 的 结果 。 因 此 ， 我 们 最 好 在 宏 定 义 中 把 每 个 参数 都 用 括号 括 起 来 。 
同样 ， 整 个 结果 表达 式 也 应 该 用 括号 括 起 来 ， 以 防止 当 宏 用 于 一 个 更 大 一 些 的 表 
达 式 时 可 能 出 现 的 问题 。 如 果 不 这 样 ， 


展开 后 的 结果 为 : 


a>0?a:-a+1 


这 个 表达 式 很 显然 是 错误 的 ， 我 们 期 望 得 到 的 是 -a， 而 不 是 -a+1! abs 的 正确 
定义 应 该 是 这 样 的 : 


#define abs(x) (((x)>=0)?(x):-(x)) 


这 时 ， 


abs(a-b) 


才 会 被 正确 地 展开 为 : 


((a-b)>@0?(a-b):-(a-b)) 


而 


abs(a)+1 


也 会 被 正确 地 展开 为 : 


((a)>9?(a):-(a))+1 


即使 宏 定义 中 的 各 个 参数 与 整个 结果 表达 式 都 被 括 写 括 起 来 ， 也 仍然 可 能 存 
在 其 他 问题 ， 比 如 ， 一 个 操作 数 如 果 在 两 处 被 用 到 ， 就 会 被 求 值 两 次 。 例 如 ， 在 
表达 式 max(a,b) 中 ， 如 果 a 大 于 b， 那 么 a 将 被 求 值 两 次 一 一 第 一 次 是 在 a 与 b 比 较 期 
间 ， 第 二 次 是 在 计算 max 应 该 得 到 的 结果 值 时 。 


这 种 做 法 不 但 效率 低下 ， 而 且 可 能 是 错误 的 : 


biggest = x[@]; 
T= 13 
while (i < n) 
biggest = max (biggest, x[i++]); 


如 果 max 是 一 个 真正 的 函数 ， 上 面 的 代码 可 以 正 稼 工作 ， 如 果 max 是 一 个 宏 ， 
那么 就 不 能 正常 工作 。 要 看 清楚 这 一 点 ， 我 们 首先 初始 化 数组 x 中 的 一 些 元 素 : 


然后 考察 在 循环 的 第 一 次 迭代 时 会 发 生 什么 。 上 面 代码 中 的 赋值 语句 将 被 扩 
展 为 : 


biggest = ((biggest)>(x[i++])?(biggest) :(x[i++])); 

首先 ， 变 量 biggest 将 与 xX[i++] 比 较 。 因 为 ij 此 时 的 值 是 1，x[1] 的 值 是 3， 而 变量 
biggest 此 时 的 值 是 x[0]〈 即 2) ， 所 以 关系 运算 的 结果 为 false〈 假 ) 。 这 里 ， 因 为 
i++ 的 副作用 ， 在 比较 后 ji 递增 为 2。 


因为 关系 运算 的 结果 为 false〈 假 ) ， 所 以 x[i++] 的 值 将 被 赋 给 变量 biggest。 然 
而 ， 经 过 i++ 的 递增 运算 后 ，i 此 时 的 值 是 2。 所 以 ， 实 际 上 赋 给 变量 biggest 的 值 是 
x[2] (BU1) 。 这 时 ， 又 因为 i++ 的 副作用 ，iji 的 值 成 为 3。 


解决 这 类 问题 的 一 个 办 法 是 ， 确 保 宏 max 中 的 参数 没有 副作用 : 


biggest = x[@]; 


for (i = 1; i < n; i++) 
biggest = max (biggest, x[i]); 


男 一 个 办 法 是 让 max 作 为 函数 而 不 是 宏 ， 或 者 直接 编写 用 来 比较 两 数 且 取 较 
大 者 的 运算 代码 : 


biggest = x[@]; 
for (i = 1; i < n; i++) 
if (x[i] > biggest) 
biggest = x[i]; 


下 面 是 男 外 一 个 例子 ， 其 中 因为 混合 了 宏和 递增 运算 的 副作用 ， 代 码 显 得 发 
发 可 危 。 这 个 例子 是 宏 putc 的 一 个 典型 定义 : 


#define putc(x,p) \ 
(--(p)->_cnt>=0?(*(p)->_ptr++=(x)):_flsbuf(x,p)) 


宏 putc 的 第 一 个 参数 是 将 要 写 入 文件 的 字符 ， 第 二 个 参数 是 一 个 指针 ， 指 疝 
一 个 用 于 描述 文件 的 内 部 数据 结构 。 请 注意 这 里 的 第 一 个 参数 x， 它 极 有 可 能 是 
类 似 于 *z++ 这 样 的 表达 式 。 尽 管 x 在 宏 putc 的 定义 中 两 个 不 同 的 地 方 出 现 了 两 次 ， 
但 是 因为 这 两 次 出 现 的 地 方 是 在 运算 符 : 的 两 侧 ， 所 以 x 只 会 被 求 值 一 次 。 


第 二 个 参数 p 则 恰恰 相反 ， 它 代表 将 要 写 入 字符 的 文件 ， 总 是 会 被 求 值 两 
fied ace ies tangas 副作用 的 操作 ， 所 以 这 很 少 引 
起 麻烦 。 不 过 ，ANSI C 标 准 还 是 提出 了 和 警告 : putc 的 第 二 个 参数 可 能 会 被 求 值 两 
CARMA A LO putc 的 
ea cate 被 不 止 一 次 求 值 ， 这 样 的 实现 是 可 能 的 。 编 程 人 员 在 给 putc 一 

副作用 的 参数 时 ， 应 该 考虑 一 BEE 否 足够 周密 。 


再 举 一 个 例子 ， 考 虑 许多 C 库 文件 中 都 有 的 toupper 函 数 ， 该 函数 的 作用 是 将 
所 有 小 写字 母 转 换 为 相应 的 大 写字 母 ， 而 其 他 的 字符 则 保持 原状 。 如 果 我 们 假定 
所 有 小 写字 母 和 所 有 大 写字 母 在 机 器 字符 集中 都 是 连续 排列 的 〈 在 大 小 写字 母 之 
间 可 能 有 一 个 固定 的 间隔 ) ， 那 么 我 们 可 以 这 样 实现 toupper 隙 数 : 


toupper(int c) 


if (c >= 'a' && c <= 'z') 
c += 'A' ?'a'; 
return c; 


EKZ ACOE A KILP, toupperké žE Val FA RERA AA RIT AB EE sc at K-F A 
数 体内 的 实际 计算 操作 。 因 此 ， 编 程 人 员 很 可 能 禁不住 要 把 toupper 实 现 为 安 : 


#define toupper(c)\ 
((c)>='a' && (c)<='z'? (c)+('A'?a'): (c)) 


在 许多 情况 下 ， 这 样 做 确实 比 把 toupper 实 现 为 函数 要 快 得 多 。 然 而 ， 如 果 编 
程 人 员 试 图 这 样 使 用 


toupper(*p++) 


则 最 后 的 结果 会 让 所 有 人 都 大 吃 一 惊 ! 


使 用 宏 的 另 一 个 危险 是 ， 宏 展开 可 能 产生 非常 庞大 的 表达 式 ， 占 用 的 空间 会 
远 远 超过 编程 人 员 所 期 望 的 空间 。 例 如 ， 让 我 们 再 看 宏 max 的 定义 : 


#define max(a,b) ((a)>(b)?(a):(b)) 


假定 我 们 需要 使 用 上 面 定 义 的 宏 max， 来 找到 a、b、c、d 这 4 个 数 中 的 最 大 
者 ， 最 显而易见 的 写法 是 : 


max(a,max(b,max(c,d))) 


上 面 的 式 子 展开 后 就 是 : 


? 


) ) ) ) 
)))) 


((a)>(((b)>(((c)>(d) 2(c) = (d))) 2 (b) = (((c) >(d) 2(c) 2 (d 
(a): (((b)>(((c)>(d)? (c): Cd) ) ) 2 (b) = (((c) > (d) 2c) : (d) 


wwe 


确实 ， 这 个 式 子 太 长 了 ! 如 果 我 们 调整 一 下 ， 使 上 式 中 操作 数 左 右 平衡 : 


max(max(a,b),max(c,d)) 


现在 这 个 式 子 展开 后 还 是 较 长 : 


ea AE eh 


(((a)>(b) ?(a): (b))) = (Cc) > (d) ?(c) (4) )) 


其 实 ， 写 成 以 下 代码 似乎 更 容易 一 些 : 


biggest = a; 

if (biggest < b) biggest = b; 
if (biggest < c) biggest = c; 
if (biggest < d) biggest = d; 


6.3 ZITA EEA 


编程 人 员 有 时 在 定义 宏 时 ， 试 图 让 其 行为 与 语句 类 似 ， 但 这 样 做 的 实际 困难 
往往 令 人 吃惊 ! 举例 来 说 ， 考 虑 一 下 assert 宏 ， 它 的 参数 是 一 个 表达 式 ， 如 果 该 表 
达 式 为 0， 就 使 程序 终止 执行 ， 并 给 出 一 条 适当 的 出 错 消息 。 把 assert 作 为 宏 来 处 
理 ， 这 样 就 使 得 我 们 可 以 在 出 错 信息 中 包含 文件 名 和 断言 失败 处 的 行 号 。 也 就 是 
说 ， 


assert(x>y); 


在 x 大 于 y 时 什么 也 不 做 ， 在 其 他 情况 下 则 会 终止 程序 。 


下 面 是 我 们 定义 assert 宏 的 第 一 次 尝试 : 


#define assert(e) if (le) assert_error(__FILE__, LINE ) 


因为 考虑 到 宏 assert 的 使 用 人 员 会 加 上 一 个 分 号 ， 所 以 在 宏 定义 中 并 没有 包括 
分 号 。_FILE_ 和 _LINE_ 是 内 建 于 C 语 言 预 处 理 器 中 的 宏 ， 它 们 会 被 扩展 为 所 
在 文件 的 文件 名 和 所 处 代码 行 的 行 号 。 


宏 assert 的 这 个 定义 ， 即 使 用 在 一 个 再 明白 不 过 的 情形 中 ， 也 会 有 一 些 难 于 察 


筑 的 错误 : 


if (x > © && y > @) 
assert(x > y); 
else 


assert(y > x); 


上 面 的 写法 似乎 很 合理 ， 但 是 它 展开 之 后 就 是 这 个 样子 : 


if (x > © && y > @) 
if(!(x > y)) assert_error("foo.c", 37); 


else 
if(!(y > x)) assert_error("foo.c", 39); 


把 上 面 的 代码 做 适当 的 缩 排 处 理 ， 我 们 就 能 够 看 清 它 实 际 的 流程 结构 与 我 们 
期 望 的 结构 有 怎样 的 区 别 : 


if (x > © && y > @) 
if(!(x > y)) 
assert_error("foo.c", 37); 


else 
if(!(y > x)) 
assert_error("foo.c", 39); 


读者 也 许 会 想到 ， 在 宏 assert 的 定义 中 用 大 括号 把 宏 体 整个 给 括 起 来 ， 就 能 避 
免 这 样 的 问题 产生 : 


#define assert(e)\ 
{ if (le) assert error( FILE , LINE ); } 


然而 ， 这 样 做 又 融 来 了 一 个 新 的 问题 。 我 们 上 面 提 到 的 例子 展开 后 就 成 了 : 


if (x > © && y > @) 
{ if(!(x > y)) assert_error("foo.c", 37)5}; 
else 


{ if(!(y > x)) assert_error("foo.c", 39);}; 


在 else 之 前 的 分 号 是 一 个 语法 错误 。 要 解决 这 个 问题 ， 一 个 办 法 是 对 assert 的 
调用 在 后 面 都 不 再 跟 一 个 分 号 ， 但 这 样 的 用 法 显得 有 些 “ 怪 异 ”: 


y= distance(p, q); 
assert(y > @) 
x = sqrt(y); 


宏 assert 的 正确 定义 很 不 直观 ， 这 个 定义 看 起 来 类 似 一 个 表达 式 ， 不 是 类 似 于 


一 个 语句 : 


#define assert(e) \ 
((void)((e)||_assert error( FILE , LINE ))) 


这 个 定义 实际 上 利用 了 | 运算 符 对 两 侧 的 操作 数 依次 顺序 求 值 的 性 质 。 如 果 e 
Atrue (A) ， 表 达 式 


(void) ((e)||_assert_error(__FILE__, LINE )) 


的 值 在 没有 求 出 其 右 侧 表达 式 


_assert error( FILE , LINE )) 
的 值 的 情况 下 就 可 以 确定 最 终 的 结果 为 真 。 如 果 e 为 false《〈 假 ) ， 碳 侧 表达 式 


_assert_error(__FILE__, LINE )) 


的 值 必须 求 出 ， 此 时 _assert_error 将 被 调用 ， 并 打印 出 一 条 恰当 的 “断言 失 
败 ” 的 出 错 消息 。 


6.4 宏 并 不 是 闫 型 定义 


宏 的 一 个 常见 用 途 是 ， 使 多 个 不 同 变量 的 类 型 可 在 一 个 地 方 说 明 : 


#define FOOTYPE struct foo 
FOOTYPE a; 
FOOTYPE b,c; 


这 样 ， 编 程 人 员 只 需 在 程序 中 改动 一 行 代码 ， 即 可 改变 a、b、c 的 类 型 ， 而 与 
a、b、c 在 程序 的 什么 地 方 声明 无 关 。 

宏 定义 的 这 种 用 法 有 一 个 优点 一 一 可 移植 性 ， 得 到 了 所 有 C 编 译 器 的 支持 。 
但 是 ， 我 们 最 好 还 是 使 用 类 型 定义 : 


typedef struct foo FOOTYPE; 


这 个 语句 定义 了 FOOTYPE 为 一 个 新 的 类 型 ， 与 struct foo 完 全 等 效 。 


这 两 种 命名 类 型 的 方式 似乎 都 差不多 ， 但 是 使 用 typedef 的 方式 要 更 加 通用 一 
些 。 例 如 ， 考 虑 下 面 的 代码 : 


#define T1 struct foo * 
typedef struct foo *T2; 


从 上 面 两 个 定义 来 看 ，T1 和 T2 从 概念 上 完全 相同 ， 都 是 指 回 结构 foo 的 指 
针 。 但 是 ， 当 我 们 试图 用 它们 来 声明 多 个 变量 时 ， 问 题 就 来 了 : 


T1 a, b; 
T2 c, d; 


第 一 个 声明 被 扩展 为 : 


struct foo * a, b; 


在 这 个 语句 中 ，a 补 定义 为 一 个 指向 结构 的 指针 ， 而 b 却 被 定义 为 一 个 结构 


〈 而 不 是 指针 ) 。 第 二 个 声明 则 不 同 ， 它 将 c 和 d 定 义 为 指向 结构 的 指针 ， 因 为 这 
里 T2 的 行为 完全 与 一 个 真实 的 类 型 相同 。 


练习 6-1 请 使 用 宏 来 实现 max 的 一 个 版 本 ， 其 中 max 的 参数 都 是 整数 ， 要 求 
在 宏 max 的 定义 中 这 些 整 型 参数 只 被 求 值 一 次 。 


练习 6-2 6.1 节 提 到 的 “表达 式 ” 


(x) ((x)-1) 


能 否 成 为 一 个 合法 的 C 表 达 式 ? 


第 7 草 ” 可 移植 性 缺陷 


C 语 言 在 许多 不 同 的 系统 平台 上 都 有 实现 。 的 确 ， 使 用 C 语 言 编写 程序 的 一 个 
首要 原因 就 是 ，C 程 序 能 够 方便 地 在 不 同 的 编程 环境 中 移植 。 


然而 ， 由 于 C 语 言 实现 是 如 此 之 多 ， 各 个 实现 之 间 有 着 或 多 或 少 的 细微 差 
别 ， 以 致 于 没有 两 个 实现 是 完全 相同 的 。 即 使 是 写 得 最 早 的 两 个 C 语 言 编 译 器 ， 
它们 之 间 也 有 着 很 大 区 别 。 此 外 ， 不 同 的 系统 有 不 同 的 需求 ， 因 此 我 们 应 该 能 够 
料 到 ， 机 器 不 同 则 其 上 的 C 语 言 实现 也 有 细微 差别 。ANSI C 标 准 的 发 布 能 够 在 一 
定 程度 上 解决 问题 ， 但 并 不 是 万 应 灵 药 。 


早期 的 C 语 言 实现 都 由 一 个 共同 的 “祖先 ”发 展 而 来 ， 因 此 在 这 些 实现 中 许多 C 
库 函 数 是 由 这 个 共同 “祖先 ”形成 的 。 此 后 人 们 开始 在 不 同 的 操作 系统 上 实现 C， 
他 们 仍然 试图 使 C 库 函数 的 行为 方式 与 早期 程序 中 所 使 用 的 库 函 数 保持 一 致 。 


这 种 尝试 并 不 总 是 成 功 的 。 而 且 ， 随 着 世界 各 地 越 来 越 多 的 人 开始 在 不 同 的 
C 语 言 实现 上 工作 ， 菜 些 库 函数 的 性 质 几 乎 注定 要 发 生 分 化 。 今 天 ， 一 个 C 程 序 员 
如 果 希 望 自己 写 的 程序 在 男 一 个 编程 环境 也 能 够 工作 ， 他 就 必须 掌握 许多 这 类 细 
小 的 差别 。 


因而 ， 可 移植 性 是 一 个 涵 亲 范 围 非常 宽泛 的 主题 。 从 这 个 主题 通常 的 形式 来 
看 ， 它 大 大 超出 了 本 书 论述 的 范围 。Mark Horton 在 他 的 著作 How to Write Portable 
Software in C 中 详细 地 讨论 了 这 个 主题 。 本 章 要 讨论 的 只 是 少数 几 个 最 常见 的 错 
误 来 源 ， 而 且 是 将 重点 放 在 语言 的 属性 上 ， 而 不 是 在 函数 库 的 属性 上 。 


7.1 应 对 C 语 言 标准 变更 


我 在 写作 本 书 的 时 候 ，ANSI 委 员 会 关于 最 新 的 C 语 言 标准 的 工作 也 接近 尾声 
了 。 这 个 标准 包括 了 许多 新 的 语言 概念 ， 这 些 概念 在 目前 的 C 编 译 器 中 并 不 是 普 
裔 地 得 到 了 支持 。 而 且 ， 即 使 我 们 可 以 合理 地 假设 C 编 译 占 销售 商会 逐渐 向 ANSI 
C 标 准 靠拢 ， 显 然 所 有 的 C 语 言 用 户 并 不 会 马上 升级 他 们 的 编译 恬 。 新 的 编译 器 花 
费 不 菲 ， 而 且 安装 也 费时 费力 。 只 要 编译 器 还 能 工作 ， 为 什么 要 蔡 换 它 呢 ? 


这 种 语言 标准 的 变更 使 得 C 程 序 的 编写 人 员 面 临 一 个 两 难 境地 : 程序 中 是 否 
应 该 用 到 新 的 特性 呢 ? 如 果 使 用 它们 ， 程 序 无 疑 更 加 容易 编写 ， 而 且 不 大 容易 出 
fits 但 是 那样 做 也 有 代价 ， 那 就 是 这 些 程序 在 较 早 的 编译 器 上 将 无 法 工作 。 


4.4 节 讨论 了 这 样 一 类 例子 : 函数 原型 的 概念 。 让 我 们 回想 一 下 4.4 节 中 提 到 
的 Square 函数 : 


double 
square(double x) 


{ 


return x*x; 


} 


如 果 这 样 写 ， 这 个 函数 在 很 多 编译 器 上 都 不 能 通过 编译 。 如 果 我 们 按照 旧 风 
格 来 重 写 这 个 函数 ， 这 就 增强 了 它 的 可 移植 性 ， 原 因 是 ANSI 标 准 为 了 保持 和 以 前 
的 用 法 兼容 ， 人 允许 使 用 这 种 形式 : 


double 
square(x) 
double x; 


{ 
} 


return x*x; 


这 种 可 移植 性 的 获得 当然 也 付出 了 代价 。 为 了 与 昌 用 法 保持 一 致 ， 我 们 必须 
在 调用 了 square 函 数 的 程序 中 作 如 下 声明 : 


double square(); 

函数 声明 中 略 去 参数 类 型 的 说 明 ， 这 在 ANSI C 标 准 中 也 是 合法 的 。 因 为 这 样 
的 声明 并 没有 对 参数 类 型 做 出 任何 说 明 ， 这 意味 着 如 果 在 函数 调用 时 传 入 了 错误 
类 型 的 参数 ， 函 数 调用 就 会 不 声 不 啊 地 失败 : 


double square(); 


main() 


printf("%g\n", square(3)); 


函数 square 的 声明 中 并 没有 对 参数 类 型 做 出 说 明 ， 因 此 在 编译 main 函 数 时 ， 
编译 器 无 法 得 知 函 数 square 的 参数 类 型 应 该 是 double， 而 不 是 int。 这 样 ， 程 序 打印 
出 的 将 是 一 堆 “ 拉 圾 信息 ”。 要 检测 这 类 问题 ， 有 一 个 办 法 就 是 使 用 第 4 章 开篇 中 提 
到 的 lint 程 序 ， 前 提 是 编程 人 员 的 C 语 言 实现 提供 了 这 一 工具 。 


如 果 上 面 的 程序 被 写成 了 这 样 : 


double square(double); 


main() 


printf("%g\n", square(3)); 


这 里 ，3 会 被 自动 转换 为 double 类 型 。 另 一 种 改写 方式 是 ， 在 这 个 程序 中 显 式 
地 给 函数 square 传 入 一 个 double 类 型 的 参数 : 


double square(); 


main() 


{ 
} 


printf ("%g\n", square(3.0)); 


这 样 做 程序 就 能 得 到 正确 的 结果 。 即 使 对 于 那些 不 允许 在 函数 声明 中 包括 参 
数 类 型 的 旧 编 译 器 ， 第 二 种 写法 也 仍然 能 够 使 程序 照常 工作 。 


许多 有 关 可 移植 性 的 决策 都 有 类 似 的 特点 。 一 个 程序 员 是 否 应 该 使 用 某 个 新 
的 或 特定 的 特性 ? 使 用 该 特性 也 许 能 给 编程 带 来 巨大 的 方便 ， 代 价 却 是 使 程序 失 
去 了 一 部 分 潜在 用 户 。 


这 个 问题 确实 难于 回答 。 程 序 的 生命 期 往往 超过 了 编程 人 员 最 初 的 预期 ， 即 
使 这 个 程序 只 是 编程 人 员 出 于 自用 的 目的 而 编写 的 。 因 此 ， 我 们 不 能 只 看 到 当前 
的 需要 ， 而 忽视 未 来 可 能 的 需要 。 然 而 ， 我 们 从 上 面 的 例子 中 己 经 看 到 : ASR 
量 增加 程序 的 可 移植 性 ， 让 过 去 的 工具 能 够 继续 工作 ， 而 放弃 现在 可 能 的 收益 ， 
这 种 代价 又 未 免 过 于 昂 吐 。 要 解决 这 类 有 关 决 定 的 问题 ， 最 好 的 做 法 也 许 就 是 承 
认 我 们 需要 下 定 决 心 才能 做 出 选择 ， 因 此 必须 慎重 对 待 ， 不 能 等 内 视 之 。 


7.2 ”标识 符 名 称 的 限制 


某 些 C 语 言 实现 把 一 个 标识 符 中 出 现 的 所 有 字符 都 当 作 有 效 字符 处 理 ， 而 男 
一 些 C 实 现 却 会 自动 地 截断 一 个 长 标识 符 名 称 的 尾部 。 链 接 占 也 会 对 它们 能 够 处 
理 的 名 称 强加 限制 ， 例 如 外 部 名 称 中 只 允许 使 用 大 写字 母 。C 实 现 人 员 在 面 对 这 
样 的 限制 时 ， 一 个 合理 的 选择 就 是 强制 所 有 外 部 名 称 必须 是 大 写 。 事 实 上 ，ANSI 
C 标 准 所 能 保证 的 只 是 ，C 实 现 必须 能 够 区 别 出 前 6 个 字符 不 同 的 外 部 名 称 。 而 且 
这 个 定义 中 并 没有 区 分 大 写字 母 和 相应 的 小 写字 母 。 


因为 这 个 原因 ， 为 了 保证 程序 的 可 移植 性 ， 要 谨慎 地 选择 外 部 标识 符 的 名 
称 ， 这 很 重要 。 比 如 ， 两 个 函数 的 名 称 分 别 为 print_fields 与 print_float， 这 样 的 命 
名 方式 就 不 恰当 ; 同 理 ， 使 用 State 与 STATE 这 样 的 命名 方式 也 不 明智 。 


下 面 这 个 例子 多 少 有 些 让 人 吃惊 ， 考 虑 以 下 函数 : 


char * 
Malloc(unsigned n) 


{ 


char *p, *malloc(unsigned) ; 
p = malloc(n); 
if (p == NULL) 
panic("out of memory"); 
return p; 


上 面 的 例子 程序 演示 了 一 个 能 确保 检测 到 内 存 耗 尽 的 简单 办 法 。 编 程 人 员 的 
想法 是 ， 在 程序 中 应 该 调用 malloc 函 数 分 配 内 存 的 地 方 ， 改 为 调用 Malloc 函 数 。 
如 果 malloc 函 数 调用 失败 ， 则 将 调用 panic 函 数 ， 用 来 终止 程序 ， 并 打印 出 一 条 恰 
当 的 出 错 消 息 。 这 样 ， 客 户 程 序 就 不 必 在 每 次 调用 malloc 函 数 时 都 要 进行 检查 。 


然而 ， 如 果 这 个 函数 的 编译 环境 是 不 区 分 外 部 名 称 大 小 写 的 C 语 言 实现 ， 将 
会 发 生 怎 样 的 情况 呢 ? 此 时 ， 函 数 malloc 与 Malloc 实 际 上 是 等 同 的 。 也 就 是 说 ， 
库 函 数 malloc 将 被 上 面 的 Malloc 函 数 等 效 蔡 换 。 当 在 Malloc 函 数 中 调用 库 函 数 


malloc 时 ， 实 际 上 调用 的 却 是 Malloc 函 数 自身 ! 当然 ， 尽 管 函 数 Malloc 在 那些 区 分 
大 小 写 的 C 语 言 实现 上 仍然 能 够 正常 工作 ， 但 在 这 种 情况 下 结果 却 是 : 程序 在 第 
一 次 试图 分 配 内 存 时 ， 对 Malloc 函 数 的 调用 将 引起 一 系列 的 递归 调用 ， 而 这 些 递 
归 调 用 又 不 存在 一 个 返回 点 ， 最 后 引发 灾难 性 的 后 果 ! 


7.3 整数 的 大 小 


C 语 言 为 编程 人 员 提 供 了 3 种 不 同 长 度 的 整数 : short 型 、int 型 和 long 型 ，C 语 
言 中 的 字符 行为 方式 与 小 整数 相似 。C 语 言 的 定义 中 对 各 种 不 同类 型 整数 的 相对 
长 度 做 了 一 些 规定 。 


1. 这 3 种 类 型 的 整数 的 长 度 是 非 递 减 的 。 也 就 是 说 ，short 型 整数 容纳 的 值 肯 
定 能 够 被 int 型 整数 容纳 ，int 型 整数 容纳 的 值 也 肯定 能 够 被 long 型 整数 容纳 。 对 于 
一 个 特定 的 C 语 言 实现 来 说 ， 并 不 需要 实际 支持 这 3 种 不 同 长 度 的 整数 ， 但 不 可 能 
让 short 型 整数 大 于 int 型 整数 ， 也 不 可 能 让 int 型 整数 大 于 long 型 整数 。 


2. 一 个 普通 〈int 类 型 ) 整数 足以 容纳 任何 数组 下 标 。 
3. 字符 长 度 由 硬件 特性 决定 。 


现代 大 多 数 机 器 的 字符 长 度 是 8 位 ， 也 有 一 些 机 右 的 字符 长 度 是 9 位 。 然 而 ， 
现在 越 来 越 多 的 C 语 言 实现 中 的 字符 长 度 都 是 16 位 ， 从 而 能 够 处 理 诸如 日 语 之 类 
的 语言 的 大 字符 集 。 


ANSI 标 准 要 求 long 型 整数 的 长 度 至 少 应 该 是 32 位 ， 而 short 型 和 int 型 整数 的 长 
度 至 少 应 该 是 16 位 。 因 为 大 多 数 机 器 中 的 字符 长 度 是 8 位 ， 对 这 些 机 器 而 言 ， 最 
方便 的 整数 长 度 是 16 位 和 32 位 ， 因 此 所 有 早期 的 C 编 译 器 也 都 能 满足 这 些 限制 条 
aa 


这 些 对 编程 实践 有 什么 意义 呢 ? 最 重要 的 一 点 就 是 在 这 方面 我 们 不 能 指望 有 
任何 可 用 的 精度 。 在 非 正式 的 情况 下 ， 我 们 可 以 说 short 型 和 int 型 整数 (普通 整 
ŽO 是 16 位 ，long 型 整数 是 32 位 ， 但 即使 是 这 些 长 度 也 是 不 能 保证 的 。 程 序 员 当 
然 可 以 用 一 个 int 型 整数 来 表示 一 个 数据 表格 的 大 小 或 者 数组 的 下 标 。 但 如 果 一 个 
变量 需要 存放 千 万 数量 级 的 数值 ， 又 该 如 何 呢 ? 


要 定义 这 样 一 个 变量 ， 可 移植 性 最 好 的 办 法 就 是 声明 该 变量 为 long 型 ， 但 在 
这 种 情况 下 我 们 定义 一 个 “新 的 ”类 型 无 疑 更 为 清晰 : 


typedef long tenmil; 


而 且 ， 程 序 员 可 以 用 这 个 新 类 型 来 声明 所 有 此 类 变量 ， 最 坏 的 情形 也 不 过 是 
我 们 只 需要 改动 类 型 定义 ， 所 有 这 些 变量 的 类 型 就 自动 变 为 正确 的 了 。 


7.4 字符 是 有 符号 整数 还 是 无 符号 整数 


现代 大 多 数 计算 机 都 支持 8 位 字符 ， 因 此 大 多 数 现代 C 编 译 器 都 把 字符 实现 为 
8 位 整数 。 然 而 ， 并 非 所 有 的 编译 器 部 按照 同样 的 方式 来 解释 这 些 8 位 数值 。 


只 有 在 我 们 需要 把 一 个 字符 值 转换 为 一 个 较 大 的 整数 时 ， 这 个 问题 才 变 得 重 
要 起 来 。 而 在 其 他 情况 下 ， 结 果 都 是 已 定义 的 : 多余 的 位 将 被 简单 地 “丢弃 ”。 编 
译 髓 在 转换 char 类 型 到 int 类 型 时 ， 需 要 做 出 选择 : 应 该 将 字符 作为 有 符号 数 处 
理 ， 还 是 应 该 将 字符 作为 无 符号 数 处 理 ? 如 果 是 前 一 种 情况 ， 编 译 器 在 将 char 类 
型 的 数 扩展 到 int 类 型 时 ， 应 该 同时 复制 符号 位 ， 而 如 果 古 后 一 种 情况 ， 编 译 器 只 
需 在 多 余 的 位 上 直接 填充 0 即 可 。 


如 果 一 个 字符 的 最 高 位 是 1， 编 译 器 是 将 该 字符 当 作 有 符号 数 ， 还 是 无 符号 
数 呢 ? 对 于 任何 一 个 需要 处 理 该 字符 的 程序 员 来 说 ， 上 述 选 择 的 结果 非常 重要 。 
它 决 定 着 一 个 8 位 字符 的 取 值 范围 是 -128 一 127， 还 是 0 一 255。 而 这 一 点 又 反 过 来 
影响 到 程序 员 对 哈 希 表 或 转换 表 等 的 设计 方式 。 


如 采编 程 人 员 关 注 一 个 最 高 位 是 1 的 字符 其 数值 究竟 是 正 还 是 员 ， 则 应 该 将 
这 个 字符 声明 为 无 符号 字符 (unsigned char) 。 这 样 ， 无 论 是 什么 编译 器 ， 在 将 
该 字符 转换 为 整数 时 ， 都 只 需 将 多 余 的 位 填充 为 0 即 可 。 而 如 果 声 明 为 一 般 的 字 
符 变 量 ， 那 么 在 某 些 编译 器 上 可 能 会 作为 有 符号 数 处理 ， 在 另 一 些 编译 器 上 又 会 
作为 无 符号 数 处 理 。 


与 此 相关 的 一 个 常见 错误 认识 是 : 如 果 c 是 一 个 字符 变量 ， 使 用 (unsigned) cit 
可 得 到 与 c 等 价 的 无 符号 整数 。 这 是 会 失败 的 ， 因 为 在 将 字符 c 转 换 为 无 符号 整数 
时 ，c 将 首先 被 转换 为 int 型 整数 ， 而 此 时 可 能 得 到 非 预期 的 结 


正确 的 方式 是 使 用 语句 (unsigned char) c， 因 为 一 个 unsigned char 类 型 的 字符 
在 转换 为 无 符号 整数 时 无 须 首 先 转 换 为 int 型 整数 ， 而 是 直接 进行 转换 。 


7.5” 移 位 运算 符 


使 用 移 位 运算 符 的 程序 员 经 常 对 以 下 两 个 问题 感到 困惑 。 


1. 在 向 右 移 位 时 ， 空 出 的 位 是 由 0 填充 ， 还 是 由 符号 位 的 副本 填充 ? 


2. 移 位 计数 〈 即 移 位 操作 的 位 数 〉 允许 的 取 值 范围 是 什么 ? 


第 一 个 问题 的 答案 很 简单 ， 但 有 时 却 是 与 具体 的 C 语 言 实现 有 关 。 如 果 被 移 
位 的 对 象 是 无 符号 数 ， 那 么 空 出 的 位 将 被 0 填充 。 如 果 被 移 位 的 对 象 是 有 符号 
数 ， 那 么 C 语 言 实现 既 可 以 用 0 填充 空 出 的 位 ， 也 可 以 用 符号 位 的 副本 填充 空 出 的 
位 。 编 程 人 员 如 果 关 注 向 右 移 位 时 空 出 的 位 ， 那 么 可 以 将 操作 的 变量 声明 为 无 符 
号 类 型 ， 那 么 空 出 的 位 都 会 被 设置 为 0。 


第 二 个 问题 的 答案 同样 也 很 简单 : 如 果 和 被 移 位 的 对 象 长 度 是 n 位 ， 那 么 移 位 
计数 必须 大 于 或 等 于 0， 而 严格 小 于 n。 因 此 ， 不 可 能 做 到 在 单 次 操作 中 将 某 个 数 
值 中 的 所 有 位 都 移出 。 为 什么 要 有 这 个 限制 呢 ? 因为 只 要 加 上 了 这 个 限制 条 件 ， 
我 们 就 能 够 在 硬件 上 高 效 地 实现 移 位 运算 。 


举例 来 说 ， 如 果 一 个 int 型 整数 是 32 位 ，n 是 一 个 int 型 整数 ， 那 么 n<<31 和 mn<<0 
这 样 写 是 合法 的 ， 而 n<<32 和 n<<-1 这 样 写 是 非法 的 。 


需要 注意 的 是 ， 即 使 C 实 现 将 符号 位 复制 到 空 出 的 位 中 ， 有 符号 整数 的 向 右 
移 位 运算 也 并 不 等 同 于 除 以 2 的 某 次 容 。 要 证 明 这 一 点 ， 让 我 们 考虑 (-1)>>1， 这 
个 操作 的 结果 一 般 不 可 能 为 0， 但 是 (-1)/2 在 大 多 数 C 实 现 上 的 求 值 结果 都 是 0。 这 
意味 着 以 除法 运算 来 代替 移 位 运算 ， 将 可 能 导致 程序 运行 速度 大 大 减 慢 。 举 例 来 
说 ， 如 果 已 知 下 面 表达 式 中 的 low+high 为 非 负 ， 那 么 


mid = (low + high) >> 1; 


与 下 式 


mid = (low + high) / 2; 


完全 等 效 ， 而 且 前 者 的 执行 速度 也 要 快 得 多 。 


7.6 ”内 存 位 置 0 


null 指 针 并 不 指向 任何 对 象 。 因 此 ， 除 非 是 用 于 赋值 或 比较 运算 ， 出 于 其 他 
任何 目的 使 用 null 指 针 都 是 非法 的 。 例 如 ， 如 果 p 或 g 是 一 个 null 指 针 ， 那 么 
strcmp(p, q) 的 值 就 是 未 定义 的 。 


在 这 种 情况 下 完 竟 会 得 到 什么 结果 呢 ? 不 同 的 编译 器 有 不 同 的 结果 。 某 些 C 
语言 实现 对 内 存 位 置 0 强加 了 硬件 级 的 读 保护 ， 在 其 上 工作 的 程序 如 果 错 误 使 用 
了 一 个 null 指 针 ， 将 立即 终止 执行 。 其 他 一 些 C 语 言 实现 对 内 存 位 置 0 只 允许 读 ， 
不 允许 写 。 在 这 种 情况 下 ， 一 个 null 指 针 似乎 指向 的 是 某 个 字符 串 ， 但 其 内 容 通 
常 不 过 是 一 堆 “ 垃 圾 信息 ”。 还 有 一 些 C 语 言 实现 对 内 存 位 置 0 既 允 许 读 ， 也 允许 
写 。 在 这 种 实现 上 面 工 作 的 程序 如 果 错 误 使 用 了 一 个 null 指 针 ， 则 很 可 能 覆盖 操 
作 系 统 的 部 分 内 容 ， 造 成 彻底 的 灾难 ! 


严格 说 来 ， 这 并 非 一 个 可 移植 性 问题 : 在 所 有 的 C 程 序 中 ， 误 用 nul 指 针 的 效 
果 都 是 未 定义 的 。 然 而 ， 这 样 的 程序 有 可 能 在 某 个 C 语 言 实现 上 “似乎 "能够 工 
作 ， 只 有 当 该 程序 转移 到 另 一 人 台 机 器 上 运行 时 问题 才 会 暴露 出 来 。 


要 检查 出 这 类 问题 的 最 简单 办 法 就 是 ， 把 程序 移 到 不 允许 读 取 内 存 位 置 0 的 
机 器 上 运行 。 下 面 的 程序 将 揭示 出 茶 个 C 语 言 实现 是 如 何 处 理 内 存 地 址 0 的 : 


#include <stdio.h> 
main() 
{ 
char *p; 
p = NULL; 
printf( "Location © contains %d\n", *p); 
} 


在 禁止 读 取 内 存 地 址 0 的 机 器 上， 这 个 程序 将 会 执行 失败 。 在 其 他 机 器 上 ， 
这 个 程序 将 会 以 十 进 制 的 格式 打印 出 内 存 位 置 0 中 存储 的 字符 内 容 。 


7.7 ”除法 运算 时 发 生 的 截断 


假定 我 们 让 a 除 以 5， 商 为 qg， 余 数 为 r : 


这 里 ， 不 妨 假定 b 大 于 0。 
我 们 希望 8B、b、q、r 之 间 维 持 怎 样 的 关系 呢 ? 


1. 最 重要 的 一 点 ， 我 们 希望 q*b +r== a， 因 为 这 是 定义 余数 的 关系 。 


2. 如 果 我 们 改变 a 的 正 负 号 ， 我 们 希望 这 会 改变 q 的 符号 ， 但 这 不 会 改变 q 的 
绝对 值 。 


3. 当 b>0 时 ， 我 们 希望 保证 r>=0 且 r<b。 例 如 ， 如 果 余 数 用 于 哈 希 表 的 索引 ， 
确保 它 是 一 个 有 效 的 索引 值 很 重要 。 


这 3 条 性 质 是 我 们 认为 整数 除法 和 余数 操作 所 应 该 具备 的 。 很 不 幸 的 是 ， 它 
们 不 可 能 同时 成 立 。 


考虑 一 个 简单 的 例子 : 3/2， 商 为 1， 余 数 也 为 1。 此 时 ， 第 1 条 性 质 得 到 了 满 
足 。(-3)/2 的 值 应 该 是 多 少 呢 ? 如 果 要 满足 第 2 条 性 质 ， 答 案 应 该 是 -1， 但 如 果 是 
这 样 ， 余 数 就 必定 是 -1， 这 样 第 3 条 性 质 就 无 法 满足 了 。 如 果 我 们 首先 满足 第 3 条 
性 质 ， 即 余数 是 1， 这 种 情况 下 根据 第 1 条 性 质 则 商 是 -2， 那 么 第 2 条 性 质 又 无 法 满 
足 了 。 


因此 ，C 语 言 或 者 其 他 语言 在 实现 整数 除法 截断 运算 时 ， 必 须 放 弃 上 述 3 条 原 
则 中 的 至 少 一 条 。 大 多 数 程 序 设计 语言 选择 了 放弃 第 3 条 ， 而 改 为 要 求 余 数 与 被 
除数 的 正 负 号 相同 。 这 样 ， 第 1 条 性 质 和 第 2 条 性 质 就 可 以 得 到 满足 。 大 多 数 C 编 


译 器 在 实践 中 也 都 是 这 样 做 的 。 


然而 ，C 语 言 的 定义 只 保证 了 第 1 条 性 质 ， 以 及 当 a>=0 且 b>0 时 ， 保 证 加 <|b| 以 
及 r>=0。 后 面部 分 的 保证 与 第 2 条 性 质 或 者 第 3 条 性 质 比较 起 来 ， 限 制 性 要 弱 得 
多 。 


C 语 言 的 定义 虽然 有 时 候 会 带 来 不 需要 的 灵活 性 ， 但 大 多 数 时 候 ， 只 要 编程 
人 员 清 楚 地 知道 要 做 什么 、 该 做 什么 ， 这 个 定义 对 于 让 整数 除法 运算 满足 其 需要 
来 说 还 是 够 用 的 。 例 如 ， 假 定 我 们 有 一 个 数 n， 它 代表 标识 符 中 的 字符 经 过 某 种 
函数 运算 后 的 结果 ， 我 们 希望 通过 除法 运算 得 到 哈 希 表 的 条 目 h， 满 足 
0<=h<HASHSIZE。 又 如 果 已 知 n 恒 为 非 员 ， 那 么 我 们 只 需要 像 下 面 一 样 简 单 地 


H? 


与 : 


h = n % HASHSIZE; 


然而 ， 如 果 n 有 可 能 为 负数 ， 而 此 时 h 也 有 可 能 为 负 ， 那 么 这 样 做 就 不 一 定 总 
是 合适 的 了 。 不 过 ， 我 们 已 知 h>-HASHSIZE， 因 此 可 以 这 样 写 : 


h = n % HASHSIZE; 
if (h < @) 
h += HASHSIZE; 


更 好 的 做 法 是 ， 程 序 在 设计 时 就 应 该 避免 n 的 值 为 负 这 样 的 情形 ， 并 且 声 明 n 
为 无 符号 数 。 


7.8 随机 数 的 大 小 


最 早 的 C 语 言 实现 运行 于 PDP-11 计 算 机 上 ， 它 提供 了 一 个 称 为 rand 的 函数 ， 
该 函数 的 作用 是 产生 一 个 〈“ 伪 ) 随机 非 负 整 数 。PDP-11 计 算 机 上 的 整数 长 度 为 16 
位 〈 包 括 了 符号 位 ) ， 因 此 rand 函 数 将 返回 一 个 介 于 0 和 22-1 之 间 的 整数 。 


当 在 VAX-11 计 算 机 上 实现 C 语 言 时 ， 因 为 这 种 计算 机 上 整数 的 长 度 为 32 位 ， 
这 就 带 来 了 一 个 实现 方面 的 问题 ，VAX-11 计 算 机 上 rand 函 数 的 返回 值 范围 应 该 是 
多 少 呢 ? 


当时 有 两 组 人 员 同 时 分 别 在 VAX-11 计 算 机 上 实现 C 语 言 ， 他 们 做 出 的 选择 互 
不 相同 。 一 组 人 员 在 加 州 大 学 伯克利 分 校 ， 他 们 认为 rand 函 数 的 返回 值 范 围 应 该 
包括 该 计算 机 上 所 有 可 能 的 非 负 整数 取 值 ， 因 此 他 们 设计 的 rand 函 数 版 本 返回 一 
个 介 于 0 和 231-1 的 整数 。 


另 一 组 人 员 在 AT&T， 他 们 认为 如 果 VAX-11 计 算 机 上 的 rand 函 数 返 回 值 范围 
与 PDP-11 计 算 机 上 的 一 样 ， 即 介 于 0 和 215-1 之 间 的 整数 ， 那 么 在 PDP-11 计 算 机 上 
写 的 程序 就 能 够 较为 容易 地 移植 到 VAX-11 计 算 机 上 。 


这 样 造成 的 后 果 是 ， 如 果 我 们 的 程序 中 用 到 了 rand 函 数 ， 在 移植 时 就 必须 根 
据 特 定 的 C 语 言 实现 做 出 “剪裁 *。ANSI C 标 准 中 定义 了 一 个 常数 RAND_MAX， 
它 的 值 等 于 随机 数 的 最 大 取 值 ， 但 是 早期 的 C 实 现 通常 都 没有 包含 这 个 常数 。 


79 ”大 小 写 转 换 
库 函 数 toupper 和 tolower 也 有 与 随机 数 类 似 的 历史 。 它 们 起 初 被 实现 为 宏 : 


#define toupper(c) ((c)+'A'-'a') 
#define tolower(c) ((c)+'a'-'A') 


当 给 定 一 个 小 写字 母 作 为 输入 时 ，toupper 将 返回 对 应 的 大 写字 母 ， 而 tolower 
的 作用 正好 相反 。 这 两 个 宏 都 依赖 于 特定 实现 中 字符 集 的 性 质 ， 即 需要 所 有 的 大 
写字 母 与 相应 的 小 写字 母 之 间 的 差 值 是 一 个 常量 。 这 个 假定 对 ASCII 字 符 集 和 
EBCDIC 字 符 集 来 说 都 是 成 立 的。 而 且 ， 因 为 这 些 宏 定义 不 能 移植 ， 且 这 些 宏 定 
义 都 被 封装 在 一 个 文件 中 ， 所 以 这 个 假定 也 并 不 那么 危险 。 


然而 ， 这 些 宏 确实 有 一 个 不 足 之 处 ， 如 果 输 入 的 字母 大 小 写 不 对 ， 那 么 它们 
返回 的 就 都 是 无 用 的 垃圾 信息 。 考 虑 下 面 的 程序 段 ， 其 作用 是 把 一 个 文件 中 的 大 
写字 母 全 部 转换 为 小 写字 母 ， 这 个 程序 段 看 上 去 没什么 问题 ， 但 实际 上 却 无 法 工 
作 : 


int c; 
while ((c = getchar()) != EOF) 
putchar (tolower (c)); 


我 们 应 该 写成 这 样 才 对 : 


int c; 
while ((c = getchar()) != EOF) 
putchar (isupper (c)? tolower (c): c); 


有 一 次 ，AT&T 软 件 开 发 部 门 的 一 个 极 具 创新 精神 的 人 注意 到 ， 大 多 数 
toupper 和 tolower 的 使 用 都 需要 首先 进行 检查 以 保证 参数 是 合适 的 。 慎 重 考 虑 之 
后 ， 他 决定 把 这 些 宏 重 写 如 下 : 


#define toupper(c) ((c) >= 'a' && (c) <= 'z'? (c) + 'A' - 'a': (c)) 
#define tolower(c) ((c) >= 'A' && (c) <= 'Z'? (c) + ‘a’ - ‘A’: (c)) 


他 又 意识 到 这 样 做 有 可 能 在 每 次 宏 调 用 时 ， 致 使 c 被 求 值 1 到 3 次 。 如 果 遇 到 类 
似 toupper(*p++) 这 样 的 表达 式 ， 可 能 会 造成 不 恨 后 果 。 因 此 ， 他 决定 将 toupper 和 
tolower 重 写 为 函数 。 重 写 后 的 toupper 函 数 看 上 去 大 致 像 下 面 这 样 : 


int 
toupper (int c) 


if (c >= 'a' && c <= 'z') 
return c + 'A' -'a'; 
return cC; 


重 写 后 的 tolower 函 数 也 与 此 类 似 。 


这 样 改动 之 后 ， 程 序 的 健壮 性 无 疑 得 到 了 增强 ， 而 代价 是 每 次 使 用 这 些 函 数 
时 叉 引 入 了 函数 调用 的 开销 。 他 意识 到 某 些 人 也 许 不 愿意 付出 效率 损失 的 代价 ， 
于 是 又 重新 引入 了 这 些 宏 ， 不 过 使 用 了 新 的 宏 名 : 


#define _toupper(c) ((c)+'A'-'a') 


#define _tolower(c) ((c)+'a'-'A') 


这 样 ， 宏 的 使 用 人 员 就 可 以 在 速度 与 方便 之 间 上 自由 选择 了 。 


里 还 有 一 个 问题 ， OO 以 及 某 些 其 他 的 
C 语 言 实现 人 员 ， 他 们 不 会 照 这 样 实现 大 小 写 的 转换 。 这 意味 着 ， 在 AT&T 的 系统 
上 我 们 编写 使 用 了 toupper 和 tolower 的 程序 时 ， 不 必 担 心 传 入 一 个 大 小 写 不 合适 的 
字母 作为 参数 ， 但 在 其 他 一 些 C 语 言 实现 上 ， 程 序 却 有 可 能 无 法 运行 。 如 果 编 程 
人 员 不 了 解 这 段 历史 ， 要 跟踪 这 类 程序 失败 就 很 困难 。 


7.10 首先 释放 ， 然 后 重新 分 配 


大 多 数 C 语 言 实现 都 为 使 用 人 员 提 供 了 3 个 内 存 分 配 函 数 : malloc、realloc 和 
free。 调 用 malloc(n) 将 返回 一 个 指针 ， 指 同一 块 新 分 配 的 可 以 容纳 n 个 字符 的 内 
存 ， 编 程 人 员 可 以 使 用 这 块 内 存 。 把 malloc 函 数 返回 的 指针 作为 参数 传 入 给 free 函 
数 ， 就 释放 了 这 块 内 存 ， 这 样 就 可 以 重新 利用 它 了 。 调 用 realloc 函 数 时 ， 需 要 把 
指向 一 块 已 分 配 内 存 的 区 域 指针 以 及 这 块 内 存 新 的 大 小 作为 参数 传 入 ， 就 可 以 调 
整 《扩大 或 缩小 ) 这 块 内 存 区 域 为 新 的 大 小 ， 这 个 过 程 中 有 可 能 涉及 内 存 的 复 
制 | 。 


几 事 镍 有 例外 。UNIX 系 统 参 考 手 册 第 7 版 中 描述 的 realloc 函 数 的 行为 ， 与 上 
面 所 讲 就 略 有 不 同 : 


realloc 函 数 把 指针 ptr 所 指向 内 存 块 的 大 小 调整 为 size 字 节 ， 返 回 一 个 指向 调整 
后 内 存 块 〈 可 能 该 内 存 块 已 经 被 移动 过 了 ) 的 指针 。 假 定 这 块 内 存 原来 大 小 为 
oldsize， 新 的 大 小 为 newsize， 这 两 个 数 之 间 的 较 小 者 为 min(oldsize, newsize)， 那 
么 内 存 块 中 min(oldsize, newsize) 部 分 存储 的 内 容 将 保持 不 变 。 


如 果 ptr 指 向 的 是 一 块 最 近 一 次 调用 malloc、realloc 或 calloc 分 配 的 内 存 ， 即 使 
这 块 内 存 已 被 释放 ，realloc 函 数 仍 然 可 以 工作 。 因 此 ， 可 以 通过 调节 free、malloc 
和 realloc 的 调用 顺序 ， 充 分 利用 malloc 函 数 的 搜索 策略 来 压缩 存储 空间 。 


也 就 是 说 ， 这 一 实现 允许 在 某 内 存 块 被 释放 之 后 重新 分 配 其 大 小 ， 前 提 是 内 
存 重 分 配 (reallocation〉 操作 执行 得 必须 足够 早 。 因 此 ， 在 符合 第 7 版 参考 手册 描 
述 的 系统 中 ， 下 面 的 代码 就 是 合法 的 : 


free (p); 
p = realloc (p, newsize); 


在 一 个 有 这 样 特殊 性 质 的 系统 中 ， 我 们 可 以 用 下 面 这 个 多 少 有 些 “ 怪 异 ” 的 办 


法 ， 来 释放 一 个 链表 中 的 所 有 元 素 : 


for (p = head; p != NULL; p = p->next) 
free ((char *) p); 


这 里 ， 我 们 不 必 担 心 调用 free 之 后 ， 会 使 p->next 变 得 无 效 。 


当然 ， 这 种 技巧 不 值得 推荐 ， 因 为 并 非 所 有 的 C 实 现在 某 块 内 存 被 释放 后 还 
能 较 长 时 间 地 保留 。 不 过 ， 第 7 版 参考 手册 还 有 一 点 没有 提 到 : 早期 的 realloc 函 数 
的 实现 要 求 等 重新 分 配 的 内 存 区 域 必 须 首先 被 释放 。 因 为 这 个 原因 ， 仍 然 还 有 一 
些 较 老 的 C 程 序 是 首先 释放 茶 块 内 存 ， 然 后 再 重新 分 配 这 块 内 存 。 当 移植 这 样 一 
个 较 老 的 C 程 序 到 一 个 新 的 实现 中 时 ， 我 们 必须 注意 到 这 一 点 。 


7.11 可 移植 性 问题 的 一 个 例子 


让 我 们 来 看 这 样 一 个 问题 ， 这 个 问题 许多 人 都 遇 到 过 ， 也 被 解决 过 许多 次 ， 
因此 非常 具有 代表 性 。 下 面 的 程序 接受 两 个 参数 .一 个 long 型 整数 和 一 个 函数 指 
针 。 这 段 程序 的 作用 是 把 给 出 的 long 型 整数 转换 为 其 十 进 制 表示 ， 并 且 对 十 进 制 
表示 中 的 每 个 字符 都 调用 函数 指针 所 指 癌 的 函数 : 


void 
printnum (long n, void (*p)()) 
{ 


if (n<) { 
(*p) ('-'); 


n = -n; 


} 
if (n >= 10) 

printnum (n/10, p); 
(*p) ((int)(n % 10) + '@'); 


这 段 程序 写 得 非常 明白 直接 。 首 先 ， 我 们 检查 n 是 否 为 负 :， 如 果 是 负数 ， 就 
打印 出 一 个 负 号 ， 然 后 让 n 反 号 ， 即 -mn。 接 着 ， 我 们 检查 n 是 否 大 于 等 于 10; WR 
是 ， 那 么 n 的 十 进 制 表 示 要 包含 两 个 或 两 个 以 上 的 数字 ， 人 然后 我 们 递归 调用 
printnum 函 数 打 印 出 n 的 十 进 制 表 示 中 除 最 后 一 位 以 外 的 所 有 数字 。 最 后 ， 我 们 打 
印 出 n 的 十 进 制 表 示 中 的 末 位 数字 。 为 了 使 *p 能 够 处 理 正确 参数 类 型 ， 这 里 把 表 
达 式 n%10 的 类 型 转换 为 int 类 型 。 这 一 点 在 ANSI CC 标准 中 其 实 并 不 必要 ， 之 所 以 
进行 类 型 转换 ， 主 要 是 为 了 避免 某 些 人 可 能 只 是 简单 地 改写 一 下 printnum 的 函数 
头 ， 就 将 程序 移植 到 早期 的 C 实 现 上 。 


人 


本 书 是 在 作者 1985 年 发 表 的 一 篇 技术 报告 的 基础 上 发 展 而 来 ， 当 时 那 篇 报告 
HH RRI 数 printnum 最 后 一 个 请 人 甸 的 写法 是 ; 


(*p) (n % 10 + '@'); 


只 有 在 那些 int 型 和 long 型 整数 的 内 部 表示 相同 的 机 器 上 ， 这 种 写法 才 是 有 效 
的 。 


这 个 程序 尽管 简单 ， 却 存在 几 个 可 移植 性 方面 的 问题 。 第 一 个 问题 出 在 该 程 
序 把 n 的 十 进 制 表示 的 末 位 数字 转换 为 字符 形式 时 所 用 的 方法 上 。 通 过 no%10 来 得 
到 末 位 数字 的 值 ， 这 一 点 没有 什么 问题 ;但 是 给 它 加 上 '0' 来 得 到 对 应 的 字符 表示 
却 不 一 定 合 适 。 程 序 中 的 加 法 操作 实际 上 假定 了 在 机 器 的 字符 集中 数字 是 顺序 排 
列 且 没有 间隔 的 ， 这 样 才 有 '0'+5 的 值 与 '5' 的 值 相同 ， 依 次 类 推 。 这 种 假定 对 
ASCII 字 符 集 和 EBCDIC 字 符 集 是 正确 的 ， 对 符合 ANSI 的 C 实 现 也 是 正确 的 ， 但 对 
某 些 机 器 却 有 可 能 出 错 。 要 避免 这 个 问题 ， 解 决 办 法 是 使 用 一 张 代表 数字 的 字符 
表 。 因 为 一 个 字符 串 常 量 可 以 用 来 表示 一 个 字符 数组 ， 所 以 在 数组 名 出 现 的 地 方 
都 可 以 用 字符 串 常 量 来 其 换 。 下 面 例 子 中 printnum 函 数 的 这 个 表达 式 虽 然 有 些 令 
人 吃惊 ， 却 是 合法 的 : 


"Q123456789"[n % 10] 


我 们 把 前 面 的 程序 进行 如 下 改写 ， 就 解决 了 第 一 个 可 移植 性 问题 : 


void 
printnum (long n, void (*p)()) 
{ 
if (n < 8) { 
(*p) ('-'); 
n =-n; 
} 
if (n >= 10) 
printnum (n/10, p); 
(*p) ("@123456789"[n % 10]); 
} 


第 二 个 问题 与 n<0 时 的 情形 有 关 。 上 面 的 程序 首先 打印 出 一 个 负 号 ， 然 后 把 n 
设置 为 nm。 这 个 赋值 操作 有 可 能 发 生 溢出 ， 因 为 基于 2 的 补 码 的 计算 机 一 般 允 许 表 


示 的 负数 取 值 范围 要 大 于 正 数 的 取 值 范围 。 有 具体 来 说 ， 就 是 如 果 一 个 long 型 整数 
有 k 位 以 及 一 个 符号 位 ， 该 long 型 整数 能 够 表示 -2* 却 不 能 表示 2*。 


要 解决 这 个 问题 ， 有 好 几 种 办 法 。 了 最 明显 的 一 种 办 法 是 把 -n 赋 给 一 个 unsigned 
long 型 的 变量 ， 然 后 对 这 个 变量 进行 操作 。 但 是 ， 我 们 不 能 对 -n 求 值 ， 因 为 这 样 
做 将 引起 溢出 ! 


无 论 是 对 基于 1 的 补 码 还 是 基于 2 的 补 码 (1’s complement and 2’s 
complement) 的 机 器 ， 改 变 一 个 正 整数 的 符号 都 可 以 确保 不 会 发 生 液 出。 唯一 的 
麻烦 来 自 于 改变 一 个 负数 的 符号 时 。 因 此 ， 如 果 我 们 能 够 保证 不 将 n 转 换 为 对 应 
的 正 数 ， 那 么 就 能 避免 这 一 问题 。 


译注 : 


有 符号 整数 的 二 进 制 表示 可 以 分 为 3 个 部 分 ， 分 别 是 符号 位 〈sign bit) 、 值 
位 (value bit) 和 补 齐 位 《padding bit) 。 补 齐 位 只 是 填 满 空白 位 置 ， 没 有 什么 意 
义 。 当 符号 位 是 1 时 表示 负数 ， 根 据 符 号 位 所 代表 数值 的 不 同 ， 分 为 one's 


comlement 和 two's complement。 假 设 值 位 共有 N 位 ， 则 


(1) one's complement: 二 进 制 表示 的 下 限 -(2N-1); 


(2) two's complement: 二 进 制 表示 的 下 限 -(2N )。 


我 们 当然 可 以 用 同样 的 方式 来 处 理 正 数 和 人 负数， 只 不 过 n 为 负数 时 需要 打印 
出 一 个 负 号 。 要 做 到 这 一 点 ， 程 序 在 打印 负 号 之 后 强制 n 为 负数 ， 并 且 让 所 有 的 
算术 运算 都 是 针对 负数 进行 的 。 也 就 是 说 ， 我 们 必须 保证 打印 负 号 的 操作 所 对 应 
的 程序 只 被 执行 一 次 ， 最 简单 的 办 法 就 是 把 程序 分 解 为 两 个 函数 。 现 在 ， 


Printnum 函 数 只 检查 n 是 否 为 负 ， 如 果 是 就 打印 一 个 负 号 。 无 论 n 为 正 为 负 ， 
printnum 函 数 都 将 调用 printneg 函 数 ， 以 n 的 绝对 值 的 相反 数 为 参数 。 这 样 ， 
printneg 函 数 就 满足 了 n 总 为 负数 或 零 的 条 件 : 


void 
printneg (long n, void (*p)()) 


if (n<=-16) 
printneg (n/10, p); 
(*p) ("0123456789"[-(n % 10)]); 


void 
printnum (long n, void (*p)()) 
{ 


if (n < 6) { 
(*p) ('-'); 
printneg (n, p); 
} else 


printneg (-n, p); 


这 样 写 在 可 移植 性 方面 还 是 有 问题 。 我 们 曾经 在 程序 中 使 用 /10 和 n%10 来 分 
别 表示 n 的 首位 数字 与 末 位 数字 ， 当 然 还 需要 适当 改变 符号 。 回 忆 一 下 ， 本 章 前 
面 提 到 : 当 整 数 除法 运算 中 的 一 个 操作 数 为 负 时 ， 它 的 行为 表现 与 具体 的 实现 有 
关 。 因 此 ， 当 n 为 负数 时 ，n9%10 完 全 有 可 能 是 一 个 正 数 ! 此 时 ，-(n % 10) 就 是 一 
个 负数 ，"0123456789"[-(n % 10)] 就 不 在 数字 数组 之 中 。 


要 解决 这 个 问题 ， 我 们 可 以 创建 两 个 临时 变量 来 分 别 保存 商 和 余数 。 在 除法 
运算 完成 之 后 ， 检 查 余 数 是 否 在 合理 的 范围 内 ;如 果 不 是 ， 则 适当 调整 两 个 变 
量 


。Pprintnum 函 数 不 需 要 进行 修改 ， 需 要 改动 的 是 Printneg 函 数 ， 因 此 下 面 我 们 只 
© HH J printneg ek žit: 


void 
printneg (long n, void (*p)()) 
{ 
long q; 
int r; 


q =n / 10; 


r= n% 10; 
if (r > 0) { 

r - =10; 
q++; 


} 
if (n <= -10) 

printneg (q, p); 
(*p) ("0123456789"[-r]); 


看 到 这 里 ， 读 者 也 许 会 叹 一 口气 ， 为 了 满足 可 移植 性 ， 需 要 做 的 工作 太 多 
T! BANAT A BA Sao. Fa eR HEE? 因为 我 们 所 处 的 是 一 个 编 
程 环 境 不 断 改 变 的 世界 ， 尽 管 软件 看 上 去 不 像 硬件 那么 实在 ， 但 大 多 数 软件 的 生 
命 期 却 要 长 于 它 运行 其 上 的 和 硬件。 而且， 我 们 很 难 预言 未 来 硬件 的 特性 。 因 此 ， 
努力 提高 软件 的 可 移植 性 ， 实 际 上 是 延长 了 软件 的 生命 期 。 


可 移植 性 强 的 软件 比较 不 容易 出 错 。 本 例 中 的 代码 改动 看 上 去 古 提 高 软件 的 
可 移植 性 ， 实 际 上 大 多 数 工 作 是 确保 边界 条 件 的 正确 性 ， 即 保证 当 printmmum 函 数 
的 参数 是 可 能 取 到 的 最 小 负数 时 ， 它 仍然 能 够 正常 工作 。 作 者 就 见 过 一 些 商 业 软 
件 产 品 ， 正 是 因为 对 这 种 情况 处 理 不 好 而 出 了 大 错 。 


练习 7-1 7.3 节 中 讲 到 ， 如 果 一 个 机 器 的 字符 长 度 为 8 位 ， 那 么 其 整数 长 度 很 
可 能 是 16 位 或 32 位 。 请 问 原 因 是 什么 ? 


练习 7-2 ”函数 atol 的 作用 是 ， 接 受 一 个 指向 以 null 结 尾 的 字符 串 的 指针 作为 参 
数 ， 返 回 一 个 对 应 的 long 型 整数 值 。 在 下 面 这 些 假设 情况 下 ， 请 写 出 atol 函 数 的 一 
个 可 移植 版 本 。 


。 作为 输入 参数 的 指针 ， 指 向 的 字符 串 总 是 代表 一 个 合法 的 long 型 整数 值 ， 因 
此 atol 函 数 无 须 检查 该 输入 是 否 越界 。 
。 唯一 合法 的 输入 字符 是 数字 和 正 负 号 。 在 遇 到 第 一 个 非法 字符 时 输入 结 


PEE ”建议 与 答案 


本 书 从 第 1 章 到 第 7 章 ， 引 领 着 读者 在 C 语 言 中 最 为 幽 微 临 蜡 的 部 分 探 奇 揽 
胜 。 读 者 看 到 了 C 语 言 是 一 个 强大 灵活 的 工具 ， 而 程序 员 一 旦 使 用 不 慎 又 是 多 人 么 
容易 导致 错误 。 我 们 的 探险 之 旅 已 经 结束 ， 读 者 也 许 感到 意犹未尽 ， 就 像 大 多 数 
曾经 阅读 过 本 书 早期 手稿 的 人 一 样 ， 禁 不 住 要 发 问 :“ 我 们 怎样 才能 避免 C 语 言 
的 这 些 问题 呢 ? ” 


也 许 最 重要 的 规避 技巧 就 是 ， 知 道 自己 在 做 什么 。 最 令 人 生 大 的 问题 都 来 自 
那些 看 起 来 能 工作 ， 其 实 却 潜藏 着 Bug 的 程序 。 正 因为 这 些 问题 潜伏 不 露 ， 要 检 
测 它们 最 容易 的 办 法 就 是 事前 周密 思考 。 拿 到 一 个 程序 不 假 思索 、 动 手 就 做 ， 使 
之 能 运行 起 来 就 万 事 大 吉 。 可 以 肯定 ， 这 样 得 到 的 只 是 一 个 “几乎 能 工作 ”的 程 
序 。 


关于 这 一 点 ， 在 我 所 知 的 范围 内 ， 道 理 说 得 最 透彻 的 应 该 是 我 在 一 本 大 键 琴 
制作 手册 上 读 到 的 一 段 话 。 这 上 段 话 的 作者 是 David Jacques Way， 他 深 说 对 知识 充 
满 白 信 的 重要 。 承 蒙 David 惠 允 ， 我 将 这 上 段 话 摘录 如 下 : 


“思考 ?是 一 切 错误 之 源 。 我 可 以 轻易 地 举 出 事实 来 证 明 这 一 点 : 犯 了 错 的 人 
总 是 会 说 :“ 哦 ， 可 是 我 原 以 为 .……” 只 要 大 键 琴 的 各 种 部 件 还 没有 黏合 到 一 起 ， 
你 就 应 该 反复 思考 直到 真正 理解 ， 这 种 “思考 ”是 无 妨 的 。 你 应 该 在 不 用 颖 合剂 的 
情况 下 把 所 有 部 件 拼装 起 来 〈 称 为 演习 或 排练 ) ， 研 究 它 们 是 如 何 接合 的 ， 并 与 
装配 图 仔细 对 照 。 


在 你 把 茶 些 部 件 务 合 起 来 之 后 ， 还 应 该 再 检查 一 迄 。 我 听 过 很 多 次 这 种 不 幸 
的 故事 :“ 昨 晚 我 做 了 什么 什么 ， 可 是 今天 早上 我 再 看 就 …...” 


亲爱 的 制作 者 ， 如 果 你 昨 晚 就 好 好 看 了 的 话 ， 那 么 你 可 能 已 经 把 不 合适 的 部 


件 拆 下 来 重新 装 好 了 。 很 多 制作 者 是 利用 业余 时 间 来 动手 DIY 一 个 大 键 蕉 ， 所 以 
经 常 妨 不 住 要 干 到 深夜 。 但 是 ， 根 据 我 接听 求助 电话 的 经 验 ， 大 多 数 错误 都 出 在 
制作 者 在 上 床 睡 觉 之 前 做 的 最 后 一 件 工 作 上 。 所 以 ， 在 准备 最 后 做 一 点 什么 之 

前 ， 你 还 是 早点 休 妃 吧 。 


上 面 这 段 文字 中 的 “把 所 有 部 件 用 黏合 剂 拼装 起 来 "， 可 以 与 程序 设计 中 “把 多 
个 小 部 分 组 合成 一 个 较 大 的 程序 "进行 类 比 。 这 样 类 比 之 后 ， 上 面 文字 中 的 建议 用 
于 程序 设计 就 再 贴切 不 过 了 。 在 实际 组 合 程序 之 前 想 清楚 应 该 如 何 组 合 ， 对 得 到 
一 个 可 靠 的 结果 至 关 重 要 。 


在 面临 时 间 压 力 的 情况 下 ， 对 程序 组 合 方式 的 理解 尤为 重要 。 编 程 人 员 几 乎 
都 有 过 这 样 的 经 历 :在 调试 程序 很 长 时 间 之 后 ， 疲 惫 不 堪 的 程序 员 开 始 漫 无 目的 
地 瞎 磁 ， 这 里 斌 一下， 那里 改 一 点 ， 如 果 凑 巧 程序 可 以 运行 了 ， 便 万 事 大 吉 。 这 
种 工作 方式 最 后 往往 会 导致 一 场 灾 难 ! 


8.1 建议 
关于 如 何 减少 程序 错误 ， 下 面 还 有 一 些 通用 的 建议 。 


不 要 说 服 自己 相信 “ 量 帝 的 新 装 ”。 有 的 错误 极 具 伪 装 性 和 欺骗 性 。 例 如 ， 
1.1 节 中 的 例子 与 出 现在 作为 本 书 最 初 原型 的 那 篇 技术 报告 中 的 例子 ， 有 一 些 细微 
的 差别 。 原 来 的 例子 是 这 样 写 的 : 


while (c == '\t' || c="'" ||c=='\n') 
c = getc(f); 


这 个 例子 在 C 语 言 中 是 非法 的 。 因 为 赋值 运算 符 = 的 优先 级 比 while 子 句 中 其 他 
运算 符 的 优先 级 都 要 低 ， 因 此 上 例 可 以 这 样 解释 : 


while ((c == '\t' [| c) = C ' [[] c == '\n')) 
c = getc(f); 


当然 ， 这 是 非法 的 : 


不 能 出 现在 赋值 运算 符 的 左 侧 。 数 以 千 计 的 人 读 过 这 个 例子 ， 但 是 却 没有 人 
注意 到 其 中 的 错误 ， 直 到 最 后 Rob Pike 为 我 指 了 出 来 。 


从 我 开始 写作 本 书 起 ， 直 到 最 后 接近 完稿 的 时 候 ， 我 一 直 没 有 去 注意 读者 对 
那 篇 技术 报告 的 评论 。 因 此 ， 上 面 这 个 错误 的 例子 就 留 在 了 手稿 中 ， 手 稿 先是 在 
贝尔 实验 室内 部 审阅 ， 后 来 Addison-Wesley 出 版 社 又 将 该 书 手 稿 送出 外 审 。 但 


是 ， 没 有 一 位 审 稿 人 注意 到 这 个 错误 。 


直 和 堆 了 当地 表明 意图 。 当 你 编写 的 代码 的 本 意 是 希望 表达 某 个 意思 ， 但 这 些 
代码 有 可 能 被 误解 为 男 一 种 意思 时 ， 请 使 用 括号 或 者 其 他 方式 让 你 的 意图 尽 可 能 
清楚 明 了。 这样 做 不 仅 有 助 于 你 日 后 重读 程序 时 能 够 更 好 地 理解 自己 的 用 意 ， 也 


方便 其 他 程序 员 日 后 维护 你 的 代码 。 


有 时 候 我 们 还 应 该 预料 哪些 错误 有 可 能 出 现 ， 在 代码 的 编写 方式 上 做 到 事先 
预防 ， 一 旦 错误 真正 发 生 ， 能 够 马上 捕获 。 例 如 ， 有 的 程序 员 把 常量 放 在 判断 相 


等 的 比较 表达 式 的 左 侧 。 换 言 之 ， 不 是 按照 习惯 的 写法 : 


while (c == '\t' || ess" * || c == '\n') 
c = getc(f); 
而 是 写 为 
while ('\t' == c || © ' == c || '\n' = c) 
c = getc(f); 


这 样 ， 如 果 程 序 员 不 小 心 把 比较 运算 符 == 写 成 了 赋值 运算 符 = ， 编 译 器 将 会 
捕获 到 这 种 错误 ， 并 给 出 一 条 编译 器 诊断 信息 : 


while ('\t' = c || ' © == c || '\n' = c) 
c = getc(f); 


上 面 的 代码 试图 给 字符 常量 \ 赋值 ， 因 而 是 非法 的 。 


考察 最 简单 的 特例 。 无 论 是 构思 程序 的 工作 方式 ， 还 是 测试 程序 的 工作 情 
况 ， 这 一 原则 都 是 适用 的 。 当 部 分 输入 数据 为 空 或 者 只 有 一 个 元 素 时 ， 很 多 程序 
都 会 执行 失败 ， 其 实 这 些 情况 应 该 是 一 早 就 应 该 考虑 到 的 。 


这 一 原则 还 适用 于 程序 的 设计 。 在 设计 程序 时 ， 我 们 可 以 首先 考虑 一 组 输入 数据 全 为 空 的 情形 ， 从 最 


=x 


闸 单 的 特例 获得 启发 。 


使 用 不 对 称 边界 。3.6 节 关于 如 何 表 示 取 值 范围 的 讨论 ， 值 得 一 读 再 读 。 在 C 
语言 中 ， 数 组 下 标 取 值 从 0 开始 ， 各 种 计数 错误 的 产生 与 这 一 点 或 多 或 少 有 关 
系 。 我 们 一 旦 理解 了 这 个 事实 ， 处 理 这 些 计数 错误 就 变 得 不 那么 困难 了 。 


注意 潜伏 在 暗 处 的 Bug。 各 种 C 语 言 实 现 之 间 都 存在 着 或 多 或 少 的 细微 差 
别 。 我 们 应 该 坚持 只 使 用 C 语 言 中 众所周知 的 部 分 ， 避 免 使 用 那些 “生僻 ?的 语言 
特性 。 这 样 做 能 够 很 方便 地 将 程序 移植 到 一 个 新 的 机 器 或 编译 器 ， 而 且 “ 遭 遇 ” 到 


编译 器 Bug 的 可 能 性 也 会 大 大 降低 。 


例如 ， 回 想 一 下 3.1 节 关于 数组 与 指针 的 讨论 ， 由 于 很 多 问题 和 事项 疝 不 确 
定 ， 讨 论 无 法 深入 下 去 ， 因 此 不 得 不 就 此 打住 。 任 何 一 个 程序 ， 如 果 它 必须 依赖 
特定 的 C 语 言 实现 来 保证 诸多 细节 的 正确 性 ， 那 么 很 可 能 在 某 个 时 候 无 法 工作 。 


对 于 那些 细节 处 的 考虑 有 人 欠 周 到 的 函数 库 实现 ， 我 们 在 编码 的 时 候 要 预先 采 
取 茶 些 防 备 性 的 措施 。 有 一 次 ， 我 在 将 一 个 程序 从 某 个 机 型 移植 到 妃 一 个 机 型 
时 ， 遇 到 了 很 大 的 麻烦 。 了 最 后 发 现 原来 是 程序 在 调用 printf 库 函数 时 ， 默 认 假 设 其 
格式 字符 串 的 长 度 可 以 达到 几 千 个 字符 长 度 。 当 然 ， 这 个 假设 并 没有 什么 错 ， 只 
是 某 些 C 语 言 实现 中 的 printf 库 函数 无 法 处 理 这 么 长 的 格式 字符 串 。 


在 你 准备 使 用 从 些 只 被 特定 厂商 的 产品 所 文 持 的 特性 时 ， 这 个 建议 束 显 得 万 
为 重要 。 记 住 ， 程 序 的 生命 期 往往 要 长 于 它 运行 其 上 的 机 器 的 生命 期 ! 


防御 性 编程 。 对 程序 用 户 和 编译 器 实现 的 假设 不 要 过 多 ! 我 还 记得 自己 在 开 
发 茶 个 系统 时 ， 曾 经 与 一 个 用 户 有 过 这 样 一 场 对 话 。 


“这 部 分 记录 中 可 能 出 现 的 代码 有 哪些 ? ” 
“可 能 的 代码 是 X、Y 和 2Z。” 

“如 果 与 X、Y 和 2Z 不 同 的 代码 在 这 里 出 现 ， 该 怎么 办 呢 ? ” 
“这 不 可 能 发 生 。” 


“ 别 ， 但 如 果 这 种 情况 确实 发 生 时 ， 程 序 需要 做 些 适当 的 处 理 。 你 认为 程序 应 
该 做 些 什么 呢 ? ” 


“这 个 我 可 不 关心 。” 


“你 真 的 不 关心 ? ” 


ej 5 ” 


“那么 ， 如 果 程 序 在 检测 到 不 同 于 、Y 和 Zz 的 代码 出 现时 删除 整个 数据 库 ， 


你 也 不 会 介意 吗 ? ” 
“ 太 死 唐 了 。 你 绝对 不 能 删除 整个 数据 库 ! ” 


“ 那 就 是 说 ， 你 还 是 介意 程序 在 这 种 情况 下 的 行为 。 那 么 ， 你 希望 程序 做 些 什 
AWE? ” 


我 们 知道 ， 再 怎么 不 可 能 发 生 的 事情 ， 在 某 些 时 候 还 是 有 可 能 发 生 的 。 要 实 
现 一 个 健壮 的 程序 ， 就 应 该 预先 考虑 到 这 种 异常 情况 。 


如 果 C 编 译 器 能 够 捕获 到 更 多 的 编程 错误 ， 这 当然 不 错 。 不 笠 的 是 ， 因 为 几 
方面 的 原因 ， 要 做 到 这 一 点 很 困难 。 最 重要 的 原因 也 许 是 历史 因素 : 长 期 以 来 ， 
人 们 习惯 于 用 C 语 言 来 完成 以 前 用 汇编 语言 做 的 工作 。 因 此 ， 许 多 C 程 序 中 总 有 这 
样 的 部 分 ， 刻 意 去 做 那些 严格 说 来 在 C 语 言 所 允许 范围 以 外 的 工作 。 最 明显 的 例 
子 就 是 类 似 操 作 系统 的 东西 。 这 样 ， 一 个 C 编 译 器 要 想 严 格 检测 程序 中 的 各 种 错 
误 ， 就 要 对 程序 中 本 意 是 可 移植 的 部 分 进行 严格 检 调 ， 同 时 对 程序 中 那些 用 来 完 
成 与 特定 机 器 相关 的 工作 的 部 分 网 开 一 面 。 


为 一 个 原因 是 ， 某 些 类 型 的 错误 从 本 质 上 说 是 难于 检测 的 。 考 虑 下 面 的 Pa 
BL: 


void set(int *p, int n) { 
x = . 
p=; 


} 


这 个 函数 是 合法 的 还 是 非法 的 ? 离开 一 定 的 上 下 文 ， 我 们 当然 不 可 能 知道 答 
案 。 如 果 像 下 面 的 代码 一 样 调用 这 个 函数 : 


int a[10]; 
set(at5, 37); 


这 当然 是 合法 的 ， 但 如 果 这 样 来 调用 set 函 数 : 


int a[10]; 
set(a+10, 37); 
上 面 的 代码 就 是 非法 的 了 。ANSI C 标 准 允 许 程 序 得 到 数组 尾 端 出 界 的 第 一 个 


位 置 的 地 址 ， 因 此 上 面 的 后 一 个 代码 段 从 它 本 身 来 说 并 没有 什么 错误 。C 编 译 器 
要 想 捕 获 到 这 样 的 错误 ， 就 必须 非常 “聪明 ”。 


但 并 不 是 说 ，C 编 译 器 要 检测 到 范围 更 广 的 程序 错误 是 不 可 能 的 。 这 不 但 有 
可 能 ， 而 且 事实 上 市 场 上 已 经 有 了 一 些 这 样 的 编译 器 。 但 是 ， 任 何 C 语 言 实现 都 
无 法 捕获 到 所 有 的 程序 错误 。 


8.2 ”答案 


0 


练习 0-1 你 是 否 愿 意 购 买 一 个 返修 率 很 高 的 三 家 所 生产 的 汽车 ? WR) RE 
明 对 它 已 经 做 出 了 改进 ， 你 的 态度 是 否 会 改变 ? 用 户 为 你 找 出 程序 中 的 bug， 你 
真正 损失 的 是 什么 ? 


我 们 之 所 以 选择 一 种 产品 而 不 选择 另 一 种 产品 ， 其 中 一 个 重要 的 考虑 因素 就 
是 广 商 的 信誉 。 如 果 信 誉 一 旦 失去 ， 就 很 难 重 新 获得 。 我 们 需要 认真 思考 一 个 问 
题 ， 即 企业 最 近 产 品 的 高 质量 是 真实 的 ， 还 是 纯 属 偶然 。 


大 多 数 人 在 已 经 知道 一 个 产品 有 可 能 存在 重大 设计 缺陷 时 ， 不 会 去 购买 这 个 


产品 一 一 除非 这 是 一 个 软件 产品 。 很 多 人 写 过 一 些 给 其 他 人 用 的 程序 。 人 们 对 软 
件 产品 不 能 工作 已 经 习以为常 ， 见 怪 不 怪 。 我 们 应 该 用 产品 的 高 质量 来 让 这 些 人 
大 吃 一 尺 。 


练习 0-2 ”修建 一 个 100 英 尺 ( 约 30.5 米 ) 长 的 护栏 ， 护 栏 的 栏杆 之 间 相 距 10 
英尺 “〈 约 3.05 米 ) ， 需 要 用 到 多 少 根 栏杆 ? 


11 根 。 围 栏 一 共 分 成 10 段 ， 但 需要 11 根 栏杆 。 请 杀 自 数 一 数 。3.6 贡 讨论 了 这 
个 问题 与 一 类 常见 的 程序 设计 错误 的 关系 。 


SSE 


练习 0-3 FER TEN EBAREAS Wart BON? 怎样 改进 菜刀 会 让 使 
用 更 安全 ? 你 是 否 愿意 使 用 这 样 一 把 经 过 改 展 的 菜刀 ? 


我 们 很 容易 想到 办 法 来 让 一 个 工具 更 安全 ， 但 代价 是 原来 简单 的 工具 现在 要 
变 得 复杂 一 些 。 食 品 加 工 机 一 般 有 连锁 装置 ， 保 护 使 用 人 员 不 让 手指 受伤 。 但 是 


菜刀 不 同 ， 给 这 样 一 个 简单 、 灵 活 的 工具 附加 保护 手指 免 于 受伤 的 装置 ， 只 能 让 
它 失 去 简单 灵活 的 特点 。 实 际 上 ， 这 样 做 最 后 得 到 的 也 许 更 像 一 台 食 品 加 工 机 ， 
mie HEK. 
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练习 1-1 ECEE. tH ANAE, BREWER à 
FREER DENA TOE RE ENS Eas, REP ABBE IE A Sh 
译 《〈《 无 错误 消息 出 现 ) ， 但 是 这 两 种 情况 下 程序 执行 的 结果 却 不 相同 。 


提示 : 


在 用 双 引 号 括 起 来 的 字符 串 中 ， 注 释 符 /* 属于 字符 串 的 一 部 分 ， 而 在 注释 中 
出 现 的 双 引 号 " "又 属于 注释 的 一 部 分 


为 了 判断 编译 器 是 否 允 许 散 套 注释 ， 必 须 找到 这 样 一 组 符号 序列 ， 使 得 无 论 
是 对 于 允许 拱 套 注释 的 编译 器 ， 还 是 不 允许 拒 套 注释 的 编译 器 ， 它 都 是 合法 的 。 
但 是 ， 对 于 两 类 不 同 的 编译 器 ， 它 却 意味 着 不 同 的 事物 。 这 样 一 组 符号 序列 不 可 
避免 地 要 涉及 舱 套 注释 ， 让 我 们 从 这 里 开始 讨论 : 


he aes | 


HTAR CHE ae, EEAS SFA MRTA, AN 
于 注释 的 一 部 分 ; MATA IRE REE ECan PE as, J TEER AN ite SESE TE TE BY) 
代码 内 容 。 也 许 有 人 因此 想到 ， 可 以 在 后 面 再 跟 一 个 用 一 对 引号 引起 的 注释 结束 
FF: 


bd Solis, aa 


如 果 人 允许 嵌 套 注释 ， 上 面 的 符号 序列 就 等 效 于 一 个 引号 ， 如 果 不 允 许 ， 就 等 
效 于 一 个 字符 串 "*"。 因 此 ， 我 们 可 以 接着 在 后 面 跟 一 个 注释 开始 符 以 及 一 个 引 


imi 
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MRIKA, ETE SESE A OT SS S| ER a Ves 如果 
不 允许 ， 就 等 效 于 一 个 用 引号 括 起 的 注释 结束 符 ， 后 跟 一 段 未 结束 的 注释 。 我 们 
可 以 简单 地 让 最 后 的 注释 结束 : 


VA St A A At hh 
这 样 ， 如 果 人 允许 蔡 套 注释 ， 上 面 的 表达 式 就 等 效 于 "*"， 如果 不 允许 ， 就 等 
效 于 "/*" 


在 我 用 类 似 于 上 面 的 形式 解决 这 个 问题 之 后 ，Doug McIlroy REL SF Kk 
让 人 拍案 叫绝 的 解法 : 
4*1*10*/**71 

这 个 解法 主要 利用 了 编译 器 进行 词法 分 析 时 使 用 的 “大 嘴 法 ”规则 。 如 果 编 译 
名 允许 散 套 注释 ， 则 上 式 将 被 解释 为 : 
a A td A 


两 个 久 符 号 与 两 个 */ 符 写 正 好 匹配 ， 所 以 上 式 的 值 就 是 1。 如 果 不 允 许 嵌 套 注 
释 ， 注 释 中 的 /* 将 被 忽略 。 因 此 ， 即 使 是 /出 现在 注释 中 ， 也 没有 特殊 的 含义 ;上 
面 的 表达 式 因 此 将 被 这 样 解释 : 


/* / */ o* /**/ 1 


它 的 值 就 是 0*1， 也 就 是 0。 


练习 1-2 如 果 由 你 来 实现 一 个 C 编 译 器 ， 你 是 否 会 允许 嵌 套 注释 ? 如 果 你 使 
用 的 C 编 译 器 允许 租 套 注释 ， 你 会 用 到 编译 器 的 这 一 特性 吗 ? 你 对 第 二 个 问题 的 


回答 是 否 会 影响 到 你 对 第 一 个 问题 的 回答 ? 


嵌 套 注释 对 于 暂时 移 除 一 块 代码 很 有 用 :在 这 块 代码 之 前 加 上 一 个 注释 开始 
符 ， 在 代码 之 后 加 上 一 个 注释 结束 符 ， 就 一 切 OK 了 。 然 而， 这 样 做 也 有 缺点 : 如 
果 用 注释 的 方式 从 程序 中 移 除 一 大 块 代码 ， 很 容易 让 人 注意 不 到 代码 已 经 被 移 除 
Te 
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就 别 无 其 他 选择 了 。 而 且 ， 一 个 编程 人 员 如 果 依 赖 供 套 注 释 ， 那 么 他 所 得 到 的 程 
序 在 很 多 编译 器 上 将 无 法 通过 。 这 样 ， 任 何 藤 套 注 释 的 使 用 ， 都 不 可 避免 地 只 能 
限制 在 那些 不 准备 以 源 代码 形式 分 发 的 程序 之 中 。 此 外 ， 在 新 的 C 语 言 实现 上 ， 
或 者 当 原 来 的 C 语 言 实现 有 了 改动 时 ， 这 样 的 程序 还 将 有 不 能 运行 的 风险 。 


出 于 这 些 原 因 ， 如 果 让 我 来 编写 一 个 C 编 译 器 ， 我 将 不 会 选择 实现 骨 套 注 
释 ;， 而 且 ， 即 使 我 所 用 的 编译 器 允许 檬 套 注 释 ， 我 也 不 会 在 程序 中 用 到 这 一 特 
性 。 当 然 ， 最 终 的 决定 还 是 应 该 由 读者 自己 做 出 。 


练习 1-3 ”为 什么 n-->0 的 含义 是 n-- > 0， 而 不 是 n- -> 0? 
根据 “大 嘴 法 ”规则 ， 在 编译 器 读 入 > 之 前 ， 就 已 经 将 -- 作 为 单个 符号 了 。 
练习 1-4 a+++++b 的 含义 是 什么 ? 


上 式 唯 一 有 意义 的 解析 方式 是 : 


a ++ + ++ b 


可 是 ， 我 们 也 注意 到 ， 根 据 “ 大 嘴 法 ”规则 ， 上 式 应 该 被 分 解 为 : 


a ++ ++ +b 


这 个 式 子 从 语法 上 来 说 是 不 正确 的 ， 它 等 价 于 : 


((a++)++) + b 


但 是 ，a++ 的 结果 不 能 作为 左 值 ， 因 此 编译 器 不 会 接受 a++ 作 为 后 面 的 ++ 运 算 
符 的 操作 数 。 这 样 ， 如 果 我 们 遵循 了 解析 词法 二 义 性 问题 的 规则 ， 上 例 的 解析 从 
语法 上 来 说 又 没有 意义 。 当 然 ， 在 编程 实践 中 ,谨慎 的 做 法 就 是 尽量 避免 使 用 类 
似 的 结构 ， 除 非 编 程 人 员 非 常 清楚 这 些 结构 的 含义 。 


练习 2-1 C 语 言 允许 初始 化 列表 中 出 现 多 余 的 逗号 ， 例 如 : 


int days[] = { 31, 28, 31, 30, 31, 30, 


31, 31, 30, 31, 30, 31,}; 


为 什么 这 种 特性 是 有 用 的 ? 


我 们 可 以 把 上 例 的 缩 排 格式 稍 作 改动 ， 如 下 : 


int days[] = { 
31, 28, 31, 30, 31, 30, 
31, 31, 30, 31, 30, 31, 


}; 


现在 我 们 可 以 很 容易 看 出 ， 初 始 化 列表 的 每 一 行 都 是 以 逗号 结尾 的 。 正 因为 
每 一 行 在 语法 上 的 这 种 相似 性 ， 自 动 化 的 程序 设计 工具 例如 代码 编辑 器 等 ) 才 
能 够 更 方便 地 处 理 很 大 的 初始 化 列表 。 


练习 2-2 2.3 节 指出 了 在 C 语 言 中 以 分 号 作为 语句 结束 的 标志 所 带 来 的 一 些 问 
题 。 虽 然 我 们 现在 考虑 改变 C 语 言 的 这 个 规定 已 经 太 迟 了 ， 但 是 设想 一 下 是 否 还 
有 其 他 办 法 来 分 隔 语句 却 是 一 件 馈 有 趣味 的 事情 。 其 他 语言 中 是 如 何 分 隔 语句 
JA? 这 些 方法 是 否 也 存在 它们 固有 的 缺陷 呢 ? 


在 Fortran 与 Snobol 语 言 中 ， 语 句 随 着 代码 行 的 结束 而 自然 结束 。 这 两 种 语言 
都 允许 一 个 语句 跨 多 个 代码 行 ， 只 要 在 语句 的 第 二 行 以 及 后 续 各 行 有 明确 的 指示 


标志 即 可 。 在 Fortran 语 言 中 ， 这 个 指示 标志 就 是 在 代码 行 的 字符 位 置 6 上 出 现 非 空 
日 字符 (代码 行 的 字符 位 置 0~~5 已 预 留 给 语句 标号 ) 。 在 Snobol 语 言 中 ， 这 个 指 
示 标 志 就 是 在 代码 行 的 字符 位 置 1 出 现 一 个 . 或 者 + 符号 。 


一 个 代码 行 的 含义 要 受到 其 后 续 代 码 行 的 影响 ， 这 一 点 多 少 显 得 有 些 “ 怪 
异 ”。 因 此 ， 某 些 程序 语言 改 为 在 第 n 行 代码 中 使 用 茶 种 指示 标志 ， 以 表示 第 n+1 
行 代码 应 该 被 当 作 同一 个 语句 的 一 部 分 。 例 如 ，UNIX 系 统 的 Shell (如 bash、 
ksh、csh 等 ) 在 代码 行 的 结尾 使 用 字符 \ 来 作为 指示 标志 ， 表 示 下 一 个 代码 行 是 
同一 个 语句 的 一 部 分 。C 语 言 在 预 处 理 融 中 以 及 字符 串 内 部 ， 沿 用 了 UNIX 系 统 中 
的 这 一 惯例 。 其 他 语言 ， 例 如 Awk 和 Ratfor， 只 要 一 个 代码 行 结束 时 还 有 从 语法 
上 来 说 需要 补足 的 不 完整 部 分 ， 例 如 一 个 运算 符 〈 要 求 后 面 跟 一 个 操作 数 ) 或 者 
一 个 左 插 号 《要求 后 面 出 现 相 应 的 右 括 号 ) ， 那 么 语句 就 被 视 为 自然 地 扩展 到 了 
下 一 个 代码 行 。 这 种 处 理 方式 虽然 难于 严格 定义 ， 但 在 编程 实践 中 应 用 起 来 似乎 
并 无 大 但 。 


练习 3-1 假定 对 于 下 标 越界 的 数组 元 素 ， 取 其 地 址 是 非法 的 ， 那 么 3.6 节 中 
的 bufwrite 程 序 应 该 如 何 写 呢 ? 


bufwrite 程 序 实际 上 隐 含 了 这 样 一 个 假定 : 即使 在 缓冲 区 完全 填 满 时 ， 
bufwrite 函 数 也 仍然 可 以 返回 ， 并 留待 下 一 次 bufwrite 函 数 被 调用 时 再 刷新 。 如 果 
旨 针 变量 bufptr 不 能 指 癌 缓冲 区 以 外 的 位 置 ， 这 个 问题 就 突然 变 得 环 手 起 来 : 我们 
应 该 如 何 指示 缓冲 区 已 满 这 种 情形 呢 ? 


最 不 麻烦 的 解决 方案 似乎 是 ， 避 免 在 缓冲 区 已 满 时 从 bufwrite 函 数 中 返回 。 要 
做 到 这 一 点 ， 我 们 就 要 把 最 后 一 个 进入 缓冲 区 的 字符 作为 特例 处 理 。 


除非 我 们 己 经 知道 指针 p 指 辐 的 并 不 是 某 个 数组 的 最 后 一 个 元 素 ， 否 则 ， 我 
们 必须 避免 对 p 进 行 递增 操作 。 也 就 是 说 ， 在 最 后 一 个 输入 字符 被 送 进 缓冲 区 之 
后 ， 我 们 就 不 应 该 再 递增 p 了 。 此 处 ， 我 们 是 通过 在 循环 的 每 次 达 代 中 增加 一 次 


额外 的 测试 来 做 到 这 一 点 的 ;， 男 一 种 可 选 的 方案 束 是 重复 整个 循环 。 


void bufwrite(char *p, int n) { 
while (--n >= @) { 

if (bufptr == &buffer[N-1]) { 
*bufptr = *p; 
flushbuffer(); 

} else 
*bufptr++ = *p; 

if (n > 6) 


p++; 


读者 可 能 注意 到 ， 这 里 我 们 小 心 层 翼 地 避免 在 缓冲 区 填 满 时 对 bufptr 进 行 递增 
操作 ， 是 为 了 不 生成 非法 地 址 buffer[N]。 


bufwrite 程 序 的 第 二 个 版 本 改 起 来 束 更 加 严 手 了 。 在 进入 程序 时 ， 我 们 知道 组 
冲 区 中 人 至少 还 有 一 个 字符 的 位 置 尚 未 填 满 ， 因 此 一 开始 我 们 并 不 需要 清空 缓冲 
X; 但 是 ， 在 程序 结束 时 ， 我 们 就 有 可 能 需要 清空 缓冲 区 了 。 与 对 bufwrite 程 序 的 
第 一 个 版 本 的 处 理 相 同 ， 我 们 在 循环 的 最 后 一 次 达 代 时 也 必须 避免 对 p 进 行 递增 


void bufwrite(char *p, int n) { 
while (n > @) { 
int k, rem; 
rem = N - (bufptr - buffer); 
k =n > rem? rem: n; 
memcpy(bufptr, p, k); 
if (k == rem) 
flushbuffer(); 
else 
bufptr += k; 
n -= k; 
if (n) 
p += k; 
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缓冲 区 中 尚未 填 满 的 字符 数 。 这 个 比较 的 目的 是 看 在 复制 操作 后 缓冲 区 是 否 已 经 


填 满 ， 如 果 缓 冲 区 已 满 ， 则 需要 清空 。 在 对 p 进 行 递 增 操作 之 前 ， 我 们 首先 检查 n 
是 否 为 0， 以 判断 本 次 碗 代 是 否 为 循环 的 最 后 一 次 迭代 。 


练习 3-2 ”比较 3.6 节 函数 flush 的 最 后 一 个 版 本 与 以 下 版 本 : 


void flush() { 
int row; 
int k = bufptr - buffer; 
if (k > NROWS) 
k = NROWS; 
for (row = @; row < k; row++) { 
int *p; 
for (p = buffer + row; p < bufptr; p += NROWS) 
printnum(*p) ; 
printnl(); 


} 
if (k > @) 
printpage(); 


flush 函 数 这 两 个 不 同 版 本 之 间 的 区 别 是 : 上面 的 flush 函 数 在 测试 k 是 否 大 于 0 
的 语句 中 只 包括 了 对 printpage 函 数 的 调用 ， 而 3.6 节 的 ftush 函 数 在 测试 语句 中 还 包 
括 了 整个 for 循 环 。3.6 节 的 fush 函 数 的 版 本 ， 用 自然 语言 描述 就 是 这 样 的 : “如 采 
缓冲 区 中 有 需要 打印 的 内 容 ， 就 把 它们 打印 出 来 ， 然 后 开始 新 的 一 页 。? 此 处 的 
flush 函 数 的 版 本 ， 用 自然 语言 描述 就 是 , “不 管 缓冲 区 中 是 否 有 剩余 的 内 容 ， 都 先 
打印 ; 如果 缓 冲 区 中 确 有 剩余 ， 则 开始 新 的 一 页 。” 与 3.6 节 中 flush 函 数 的 版 本 相 
比 ， 这 个 版 本 中 的 k 在 for 循 环 里 的 作用 就 不 其 明显 。 在 3.6 节 的 版 本 中 ， 我 们 可 以 
很 容易 看 出 k 的 作用 : 当 k 为 0 时 ， 将 跳 过 循环 。 


里 然 从 技术 上 说 flush 函 数 的 这 两 个 版 本 是 等 价 的 ， 但 是 它们 所 表达 的 编程 意 
图 却 有 细微 的 差别 。 最 能 够 反映 程序 员 实 际 编程 意图 的 版 本 ， 就 是 最 好 的 版 本 。 


练习 3-3 ”编写 一 个 函数 ， 对 一 个 已 排序 的 整数 表 执行 二 分 查找 。 函 数 的 输入 
包括 一 个 指向 表 头 的 指针 、 表 中 的 元 素 个 数 以 及 待 但 找 的 数值 。 函 数 的 输出 是 一 
个 指 同 满足 查找 要 求 的 元 素 的 指针 ， 当 未 碍 找到 要 求 的 数值 时 ， 输 出 一 个 NULL 
Het 


二 分 查找 从 概念 上 来 说 非常 简单 ， 但 是 在 编程 实践 中 人 们 经 第 不 能 正确 实 
现 。 这 里 ， 我 们 将 开发 出 二 分 碍 找 的 两 个 版 本 ， 它 们 都 用 到 了 不 对 称 边界 。 第 一 
个 版 本 用 的 是 数组 下 标 ， 第 二 个 版 本 用 的 是 指针 。 


不 妨 假定 竺 搜索 的 元 际 为 x， 如 果 X 存 在 于 数组 中 的 话 ， 那 么 我 们 假定 它 在 数 
组 中 的 下 标 为 k。 最 开始 ， 我 们 只 知道 0<=k <n 。 我 们 的 目标 是 不 断 缩小 k 的 取 值 
范围 ， 直 至 找到 要 搜索 的 元 素 ， 或 者 能 够 判定 数组 中 不 存在 这 样 的 元 素 。 


为 了 做 到 这 一 点 ， 我 们 把 x 与 位 于 可 能 范围 中 间 位 置 的 元 素 进行 比较 。 如 果 x 
与 该 元 素 相等 ， 我 们 就 大 功 告 成 。 如 果 两 者 不 相等 ， 位 于 该 元 素 的 “错误 ”一 侧 的 
所 有 元 素 ， 我 们 就 可 以 不 予 考 虑 ， 这 样 束 缩小 了 搜索 的 范围 。 图 8-1 显 示 了 搜索 过 
程 中 的 情况 。 
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图 8-1 二 分 查找 示意 图 


任何 时 候 ， 我 们 都 假定 lo 和 hi 是 不 对 称 边 界 的 两 头 。 也 就 是 说 ， 我 们 要 求 
lo<= k <hi。 如 果 1lo 与 hi 相等 ， 此 时 可 能 范围 己 经 缩 为 空 ， 我 们 就 能 判定 x 不 在 表 
中 。 


如 果 lo 小 于 hi， 那 么 可 能 范围 中 至 少 存 在 一 个 元 素 。 我 们 不 妨 设 定 mid 为 可 能 
范围 的 中 值 ， 然 后 比较 x 与 整数 表 中 下 标 为 mid 的 元 素 。 如 果 x 比 该 元 素 小 ， 那 么 
mid 就 是 位 于 可 能 范围 以 外 的 最 小 下 标 ， 因 此 我 们 可 以 设置 hi = mid。 如 果 x 比 该 元 
素 大 ， 那 么 mid+1 就 是 位 于 新 的 已 缩减 的 可 能 范围 以 内 的 最 小 下 标 ， 因 此 我 们 可 
以 设置 lo = mid+1。 最 后 ， 如 果 x 与 该 元 素 相等 ， 我 们 就 完成 了 搜索 。 


我 们 是 否 可 以 设置 mid = (hi+10)/2， 这 样 设置 会 带 来 什么 问题 吗 ? 如 果 hi 与 lo 
相隔 较 远 ， 这 样 做 显然 不 会 有 什么 问题 。 但 是 ， 如 果 hi 与 lo 隔 得 很 近 ， 又 是 怎样 
的 情况 呢 ? 


等 于 lo 的 情况 根本 用 不 着 考虑 。 因 为 此 时 我 们 已 经 知道 x 的 可 能 范围 为 空 ， 
我 们 甚至 不 需要 设置 mid。 当 hi = lo + 2 时， 这 也 不 是 问题 ，hi + lo 等 于 2 x lo + 2， 
这 是 一 个 偶数 ， 因 此 (hi + lo)/2 等 于 lo + 1。 当 hi = lo + 1 时 ， 情 况 又 如 何 呢 ? 在 这 
种 情况 下 ， 可 能 范围 中 的 唯一 元 素 就 是 lo， 因 此 如 果 (hi + lo)/2 等 于 lo， 这 个 结果 
才 是 我 们 可 接受 的 。 


幸运 的 是 ， 由 于 hi + lo 恒 为 正 数 ，(hi + lo)/2 会 得 到 我 们 希望 的 结果 lo。 因 为 
在 这 种 情况 下 ， 整 数 除法 肯定 将 会 被 截 断 处 理 。 因 此 ，(hi + lo)/2 等 价 于 (do + 
1D)+loy2， 亦 即 (2 x lo+1)/2， 这 个 式 子 的 结果 就 是 lo。 


根据 上 面 的 讨论 ， 这 个 程序 大 致 如 下 : 


int * bsearch(int *t, int n, int x) { 
int lo = ð, hi =n; 
while (lo < hi) { 
int mid = (hi + lo) / 2; 
if (x < t[mid]) 
hi = mid; 
else if (x > t[mid]) 
lo = mid + 1; 
else 
return t + mid; 


} 
return NULL; 


值得 注意 的 是 ， 下 面 求 值 表达 式 : 


int mid = (hi + lo) / 2; 
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int mid = (hi + lo) >> 1; 


这 样 做 确实 会 提高 程序 的 运行 速度 。 现 在 还 是 让 我 们 首先 去 掉 一 些 寻 址 运 
算 ， 原 因 是 在 很 多 机 器 上 下 标 运算 都 要 比 指针 运算 慢 。 我 们 可 以 把 trmid 的 值 存 储 
在 一 个 局 部 变量 中 ， 这 样 就 不 需要 每 次 都 重新 计算 ， 从 而 可 以 稍微 减少 一 些 寻 址 


运算 : 


int * bsearch(int *t, int n, int x) { 
int lo = ð, hi =n; 
while (lo < hi) { 
int mid = (hi + lo) / 2; 
int *p = t + mid; 
if (x < *p) 
hi = mid; 
else if (x > *p) 
lo = mid + 1; 
else 
return p; 


return NULL; 


又 假定 我 们 希望 进一步 减少 寻 址 运算 ， 这 可 以 通过 在 整个 程序 中 用 指针 代 蔡 
下 标 来 做 到 。 乍 一 看 ， 我 们 似乎 只 要 按部就班 地 把 程序 中 凡 用 到 下 标的 地 方 ， 统 
统 改 用 指针 的 形式 重 写 一 过 即 可 : 


int * bsearch(int *t, int n, int x) { 
int *lo = t, *hi = t + n; 
while (lo < hi) { 
int *mid = (hi + lo) / 2; 
if (x < *mid) 
hi = mid; 
else if (x > *mid) 
lo = mid + 1; 
else 
return mid; 


} 
return NULL; 


实际 上 ， 这 个 程序 是 “ 功 败 垂 成 ?>， 还 差 一 点 就 可 以 工作 了 。 问 题 出 在 下 面 的 
语句 : 


mid = (lo + hi) / 2; 


这 个 语句 是 非法 的 ， 因 为 它 试 图 把 两 个 指针 相 加 。 正 确 的 做 法 是 ， 先 计算 出 
lo 与 hi 之 间 的 距离 〈 这 可 以 由 指针 减法 得 到 ， 并 且 结 果 是 一 个 整数 ) ， 然 后 把 这 
个 距离 的 一 半 《 也 仍然 是 整数 ) 与 lo 相 加 : 


[mid = 10 + (ħi - 10) 423; | 

上 面 的 hi - lo 计算 出 结果 之 后 ， 还 要 对 它 做 除法 运算 。 虽 然 大 多 数 C 编 译 器 都 
足够 "智能 "， 会 自动 地 把 这 类 除法 运算 实现 为 移 位 运算 以 优化 程序 性 能 ， 但 对 于 
这 里 的 除 2 运算 ， 这 些 编译 器 还 不 够 智能 ， 不 会 把 它 实现 为 移 位 运算 。 因 为 编译 
器 所 知道 的 只 是 hi - lo 可 能 为 负 ， 而 对 负数 来 说 ， 除 2 运算 和 移 位 运算 会 得 到 不 同 
的 结果 。 因 此 ， 我 们 确实 应 该 自己 手动 把 它 写成 移 位 运算 的 形式 : 


mid = lo + (hi - lo) >> 1; 


很 不 地， 这 样 写 还 是 不 对 。 一 定 要 记 住 移 位 运算 符 的 优先 级 低 于 算术 运算 符 
的 优先 级 ! 因此 ， 我 们 必须 写成 : 


mid = lo + ((hi - lo) >> 1); 


最 后 ， 完 整 的 程序 如 下 : 


int * bsearch(int *t, int n, int x) { 
int *lo = t, *hi =t+n; 
while (lo < hi) { 
int *mid = lo + ((hi - lo) >> 1); 
if (x < *mid) 
hi = mid; 
else if (x > *mid) 
lo = mid + 1; 
else 
return mid; 


} 
return NULL; 


顺便 说 一 下 ， 二 分 查找 经 常用 对 称 边 界 来 表达 。 因 为 采用 了 对 称 边界 后 ， 最 
后 得 到 的 程序 看 上 去 要 整齐 许多 : 


int * bsearch(int *t, int n, int x) { 
int lo = 0, hi =n -1; 
while (lo <= hi) { 
int mid = (hi + lo) / 2; 
if (x < t[mid]) 
hi = mid - 1; 
else if (x > t[mid]) 


lo = mid + 1; 
else 
return t + mid; 


} 
return NULL; 


然而 ， 如 果 我 们 试图 把 上 面 的 程序 改写 成 “ 纯 指针 ”的 形式 ， 束 会 过 到 麻烦 。 
问题 在 于 ， 我 们 不 能 把 hi 初始 化 为 t+ n - 1。 因 为 当 n 为 0 时 ， 这 是 个 无 效 地 址 ! 
此 ， 如 果 我 们 还 想 把 程序 改写 成 指针 形式 ， 就 必须 对 n=0 的 情形 进行 单独 测试 。 
这 从 男 一 个 角度 义 一 次 说 明了 为 什么 应 该 采用 不 对 称 边界 。 


练习 4-1 假定 一 个 程序 在 一 个 源 文件 中 包含 了 声明 : 


long foo; 


而 在 男 一 个 源 文件 中 包含 了 : 


extern short foo; 

又 进一步 假定 ， 如 果 给 long 类 型 的 foo 赋 一 个 较 小 的 值 ， 例 如 37， 那 么 Short 类 
型 的 foo 就 同时 获得 了 一 个 值 37。 我 们 能 够 对 运行 该 程序 的 硬件 做 出 什么 样 的 推 
Wr? 如 果 short 类 型 的 foo 得 到 的 值 不 是 37 而 是 0， 我 们 又 能 够 做 出 什么 样 的 推断 ? 


如 果 把 值 37 赋 给 long 型 的 foo， 相 当 于 同时 把 值 37 也 赋 给 了 short 型 的 foo， 那 么 
这 意味 着 short 型 的 foo 与 long 型 的 foo 中 包含 了 值 37 的 有 效 位 的 部 分 ， 两 者 在 内 存 中 
占用 的 是 同一 区 域 。 这 有 可 能 是 因为 long 型 和 short 型 被 实现 为 同一 类 型 ， 但 很 少 
有 C 语 言 的 实现 会 这 样 做 。 更 有 可 能 的 是 ，long 型 的 foo 的 低位 部 分 与 short 型 的 foo 
共享 了 相同 的 内 存 空间 ， 一 般 情况 下 ， 这 个 部 分 所 处 的 内 存 地 址 较 低 ; 因此 我 们 
的 一 个 可 能 推论 就 是 ， 运 行 该 程序 的 硬件 是 一 个 低位 优先 (ittle-endian〉 的 机 
器 。 同 样 道理 ， 如 果 在 long 型 的 foo 中 存储 了 值 37， 而 short 型 的 foo 的 值 却 是 0， 我 
们 所 用 的 硬件 可 能 是 一 个 高 位 优先 (big-endian〉 的 机 器 。 


PEE: 


endian 的 意思 是 “数据 在 内 存 中 的 字 节 排列 顺序 ”， 表 示 一 个 字 在 内 存 中 或 传 
送 过 程 中 的 字 节 顺序 。 在 微 处 理 器 中 ， 像 long/DWORD (32 bit) 0x12345678 这 样 
的 数据 总 是 按照 高 位 优先 方式 存放 的 。 但 在 内 存 中 ， 数 据 存放 顺序 则 因 微 处 理 器 
厂商 的 不 同 而 不 同 。 一 种 顺序 称 为 big-endian， 即 把 最 高 位 字 节 放 在 最 前 面 ， 另 一 
种 顺序 就 称 为 little-endian， 即 把 最 低位 字 节 放 在 最 前 面 。 


big-endian: 最 低地 址 存放 高 位 字 节 ， 可 称 为 高 位 优先 。 内 存 从 最 低地 址 开 
台 ， 按 顺序 存放 。 这 种 存放 方式 正 是 我 们 的 书写 方式 ， 高 数位 数字 先 写 〈 比 如 ， 
总 是 按照 和 于 、 百 、 十 、 个 位 来 书写 数字 ) ， 而 且 所 有 处 理 器 都 是 按照 这 个 顺序 存 
放 数 据 的 。 


little-endian: 最 低地 址 存放 低位 字 节 ， 可 称 为 低位 优先 。 内 存 从 最 低地 址 开 
人 ， 顺 序 存放 。little-endian 处 理 器 是 通过 硬件 将 内 存 中 的 ]little-endian 排 列 顺序 转 
换 为 寄存 器 的 big-endian 排 列 顺序 ， 因 此 没有 数据 加 载 /存储 的 开销 。 


练习 4-2 4.4 节 中 讨论 的 错误 程序 ， 经 过 适当 简化 后 如 下 所 示 : 


#include <stdio.h> 


main() { 
printf("%g\n", sqrt(2)); 


} 


在 某 些 系 统 中 ， 打 印 出 的 结果 是 : 


%g 


请 问 这 是 为 什么 ? 


在 某 些 C 语 言 实 现 中 ， 存 在 着 两 种 不 同 版 本 的 printf 函 数 ， 其 中 一 种 实现 了 用 


于 表示 浮 点 格式 的 项 ， 如 %e、%f、%g 等 ; 另 一 种 却 没有 实现 这 些 浮 点 格式 。 库 
文件 中 同时 提供 了 Printf 函 数 的 两 种 版 本 ， 这 样 的 话 ， 那 些 没 有 用 到 浮 点 运算 的 程 
序 ， 就 可 以 使 用 不 提供 浮 点 格式 支持 的 版 本 ， 从 而 节省 程序 空间 ， 减 少 程序 大 
小 。 


在 茶 些 系统 上 ， 编 程 人 员 必 须 显 式 地 通知 链接 器 是 否 用 到 了 浮 点 运算 ; 而 男 
一 些 系 统 ， 则 是 通过 编译 器 来 告知 链接 占 在 程序 中 是 否 出 现 了 浮 点 运算 ， 以 自动 
地 做 出 决定 。 


上 面 的 程序 没有 进行 任何 浮 点 运算 ! 它 既 没有 包含 math.h 头 文件 ， 也 没有 声 
明 sqrt 函 数 ， 因 此 编译 器 无 从 得 知 sqrt 是 一 个 浮 点 函数 。 这 个 程序 甚至 都 没有 传送 
一 个 浮 点 参数 给 sqrt 函 数 。 所 以 ， 编 译 器 “ 自 认 合理 ”地 通知 链接 器 ， 该 程序 没有 进 
行 浮 点 运算 。 


那 sqrt 函 数 义 怎么 解释 呢 ?” 难 道 “sqrt 函 数 是 从 库 文件 中 取出 的 ”这 个 事实 ， 还 
不 足以 证 明 该 程序 用 到 了 浮 点 运算 ? 当然 , “sqrt 函 数 是 从 库 文 件 中 取出 的 ”这 一 点 
没 错 ， 但 是 ， 链 接 器 可 能 在 从 库 文 件 中 取出 sqrt 函 数 之 前 ， 就 已 经 做 出 了 使 用 何 
种 版 本 的 printf 函 数 的 决定 。 


练习 5-1 当 一 个 程序 蜡 第 终止 时 ， 程 序 输出 的 最 后 几 行 常常 会 丢失 ， 原 因 是 
什么 ? 我 们 能 够 采取 怎样 的 措施 来 解决 这 个 问题 ? 


一 个 异常 终止 的 程序 可 能 没有 机 会 来 清空 其 输出 缓冲 区 。 因 此 ， 该 程序 生成 
的 输出 可 能 位 于 内 存 的 某 个 位 置 ， 但 却 永 远 不 会 被 写 出 了 。 在 某 些 系统 上 ， 这 些 
无 法 被 写 出 的 输出 数据 可 能 长 达 好 几 页 。 


对 于 试图 调试 这 类 程序 的 编程 人 员 来 说 ， 这 种 丢失 输出 的 情况 经 常会 误导 他 
们 ， 因 为 这 会 造成 这 样 一 种 印象 ， 即 程序 发 生 失 败 的 时 刻 比 实 际 上 运行 失败 的 真 
正 时 刻 要 早 得 多 。 人 解决 方 案 就 是 在 调试 时 强制 不 允许 对 输出 进行 缓冲 。 要 做 到 这 
一 点 ， 不 同 的 系统 有 不 同 的 做 法 ， 这 些 做 法 虽然 存在 细微 差别 ， 但 大 致 如 下 : 


setbuf (stdout, (char *)@); 


这 个 语句 必须 在 任何 输出 被 号 入 stdout〈 包 括 任 何 对 printf 函 数 的 调用 ) 之 前 
执行 。 该 语句 最 恰当 的 位 置 就 是 作为 main 函 数 的 第 一 个 语句 。 


练习 5-2 ”下面 程序 的 作用 是 把 它 的 输入 复制 到 输出 : 


#include <stdio.h> 
main() { 
register int c; 
while ((c = getchar()) != EOF) 
putchar(c); 


从 这 个 程序 中 移 除 #include 语 句 ， 将 导致 程序 不 能 通过 编译 ， 因 为 这 时 EOF 是 
未 定义 的 。 假 定 我 们 手工 定义 了 EOF (当然 ， 这 是 一 种 不 好 的 做 法 ): 


#define EOF -1 
main() { 
register int c; 
while ((c = getchar()) != EOF) 
putchar(c); 


这 个 程序 在 许多 系统 中 仍然 能 够 运行 ， 但 是 在 某 些 系统 运行 起 来 却 慢 得 多 。 


这 是 为 什么 ? 


D 


函数 调用 需要 花费 较 长 的 程序 执行 时 间 ， 因 此 getchar 经 常 被 实现 为 宏 。 这 个 
宏 在 stdio.h 头 文件 中 定义 ， 因 此 如 果 一 个 程序 没有 包含 stdio.h 头 文件 ， 编 译 器 对 
getchar 的 定义 就 一 无 所 知 。 在 这 种 情况 下 ， 编 译 器 会 假定 getchar 是 一 个 返回 类 型 
为 整 型 的 函数 。 


实际 上 ， 很 多 C 语 言 实 现在 库 文件 中 都 包括 getchar 函 数 ， 部 分 原因 是 预防 编 
Ea 心 大 意 ， 另 外 部 分 原因 是 为 了 方便 那些 需要 得 到 getchar 地 址 的 编程 人 

。 因 些 ， 程 序 中 忘记 包含 stdio.h 头 文件 的 结果 就 是 ， 在 所 有 getchar 宏 出 现 的 地 
方 ， 都 用 getchar 函 数 调用 来 蔡 换 getchar 宏 。 这 个 程序 之 所 以 运行 变 慢 ， 就 是 因为 


函数 调用 所 导致 的 开销 增多 。 同 样 的 依据 也 完全 适用 于 putchar。 


练习 6-1 请 使 用 宏 来 实现 max 的 一 个 版 本 ， 其 中 max 的 参数 都 是 整数 ， 要 求 
在 宏 max 的 定义 中 这 些 整 型 参数 只 被 求 值 一 次 。 


max 宏 的 每 个 参数 的 值 都 有 可 能 使 用 两 次 : 一 次 是 在 两 个 参数 做 比较 时 ; 一 
次 是 在 把 它 作 为 结果 返回 时 。 因 此 ， 我 们 有 必要 把 每 个 参数 存储 在 一 个 临时 变量 
中 。 


遗憾 的 是 ， 我 们 没有 直接 的 办 法 可 以 在 一 个 C 表 达 式 的 内 部 声明 一 个 临时 变 
量 。 因 此 ， 如 果 我 们 要 在 一 个 表达 式 中 使 用 max 宏 ， 就 必须 在 其 他 地 方 声明 这 些 
临时 变量 ， 比 如 可 以 在 宏 定 义 之 后 ， 但 不 是 将 这 些 变量 作为 宏 定 义 的 一 部 分 进行 
声明 。 如 果 max 宏 用 于 不 止 一 个 程序 文件 ， 我 们 应 该 把 这 些 临时 变量 声明 为 
static， 以 避免 命名 种 突 。 不 妨 假定 这 些 定 义 将 出 现在 某 个 头 文件 中 : 


static int max_temp1, max_temp2; 
#define max(p, q) (max_temp1=(p),max_temp2=(q), \ 
max_temp1>max_temp2? max_temp1:max_temp2) 


只 要 不 是 典 套 调用 max 宏 ， 上 面 的 定义 都 能 正常 工作 ;在 舱 套 调用 max 宏 的 情 
况 下 ， 我 们 不 可 能 做 到 让 它 正常 工作 。 


练习 6-2 6.1 节 中 提 到 的 “表达 式 ” 


(x) ((x)-1) 


能 否 成 为 一 个 合法 的 C 表 达 式 ? 


一 种 可 能 是 ， 如 果 x 是 类 型 名 ， 例 如 x 被 这 样 定义 : 


typedef int x; 


在 这 种 情况 下 ， 


(x) ((x)-1) 


等 价 于 


(int) ((int)-1) 
这 个 式 子 的 含义 是 把 常数 -1 转换 为 int 类 型 两 次 。 我 们 也 可 以 通过 预 处 理 指令 
来 定义 x 为 一 种 类 型 ， 以 达到 同样 的 效果 : 


#define x int 
男 一 种 可 能 是 当 x 为 函数 指针 时 。 回 忆 一 下 ， 如 果 某 个 上 下 文中 本 应 需要 函 
数 而 实际 上 用 了 函数 指针 ， 那 么 该 指针 所 指 加 的 函数 将 会 自动 地 被 取得 并 符 换 这 
个 函数 指针 。 因 此 ， 本 题 中 的 表达 式 可 以 被 解释 为 调用 x 所 指 问 的 函数 ， 这 个 函 
数 的 参数 是 (x)-1。 为 了 保证 (x)-1 是 一 个 合法 的 表达 式 ，x 必 须 实际 指 疝 一 个 函数 
旨 针 数组 中 的 茶 个 元 素 。 


x 的 完整 类 型 是 什么 呢 ? 为 了 方便 讨论 问题 ， 我 们 假定 x 的 类 型 是 T， 因 此 可 
以 如 下 声明 x: 
T X; 

显而易见 ，x 必 须 是 一 个 指针 ， 所 指向 的 函数 的 参数 类 型 是 T。 这 一 点 让 T 比 
较 难以 定义 。 下 面 是 最 容易 想到 的 办 法 ， 但 却 没 有 用 : 


因为 只 有 当 T 已 经 被 声明 之 后 ， 才 能 这 样 定义 T! 不 过 ，x 所 指向 的 函数 的 参 
数 类 型 并 不 一 定 要 是 T， 它 可 以 是 任何 T 可 以 被 转换 成 的 类 型 。 具 体 来 说 ，void * 
类 型 就 完全 可 以 : 


typedef void (*T)(void *); 


这 个 练习 的 用 意 在 于 说 明 ， 对 于 那些 看 上 去 无 从 着 手 、 形 式 “ 怪 异 ” 的 结构 ， 


我 们 不 应 该 轻率 地 一 律 将 其 作为 错误 来 处 理 。 


练习 7-1 7.3 节 中 讲 到 ， 如 果 一 个 机 器 的 字符 长 度 为 8 位 ， 那 么 其 整数 长 度 很 
可 能 是 16 位 或 32 位 。 请 问 原 因 是 什么 ? 


茶 些 机 器 为 每 个 字符 分 配 一 个 唯一 的 内 存 地 址 ， 而 男 一 些 机 器 却 是 按 字 来 对 
内 存 寻 址 。 按 字 寻 址 的 机 器 通常 都 存在 不 能 有 效 处 理 字符 数据 的 问题 ， 因 为 要 从 
内 存 中 取得 一 个 字符 ， 就 必须 读 取 整 个 字 的 内 容 ， 然 后 把 不 需要 用 到 的 部 分 都 丢 


FF 


由 于 按 字符 寻 址 的 机 型 在 字符 处 理 方面 具有 效率 优势 ， 它 们 相对 于 按 字 寻 址 
的 机 型 ， 近 年 来 要 更 为 流行 。 然 而 ， 即 使 对 于 按 字符 寻 址 的 机 器 ， 在 进行 整数 运 
算 时 字 的 概念 也 仍然 是 重要 的 。 因 为 字符 在 内 存 中 的 存储 位 置 是 连续 的 ， 所 以 一 
个 字 中 包含 的 字符 数 ， 将 决定 在 内 存 中 连续 存放 的 字 的 地 址 。 


如 果 一 个 字 中 包含 的 字符 数 是 2 的 茶 次 需 ， 因 为 乘 以 2 的 茶 次 医 的 运算 可 以 转 
换 为 移 位 运算 ， 所 以 计算 机 硬件 就 能 很 容易 地 完成 从 字符 地 址 到 字 地 址 的 转换 。 
因此 ， 我 们 可 以 合理 地 预期 ， 字 的 长 度 是 字符 长 度 的 2 的 茶 次 需 。 


那么 整数 的 长 度 为 什么 不 是 64 位 呢 ? 当然 ， 茶 些 时 候 这 样 做 无 疑 是 有 用 的 。 
但 是 ， 对 于 那些 具有 浮 点 运算 人 硬件 的 机 器 ， 这 样 做 的 意义 就 不 大 了 ， 而 且 考 虑 到 
我 们 并 不 经 常 需要 用 到 64 位 整数 这 样 的 精度 ， 实 现 64 位 整数 的 代价 就 过 于 昂贵 。 
如 果 只 是 侦 尔 用 a 到， 我 们 完全 可 以 用 软件 来 模拟 64 位 (或 者 更 长 的 整数 ， 而 且 
丝 坚 不 影响 效率 。 


练习 7-2 ”函数 atol 的 作用 是 ， 接 受 一 个 指向 以 null 结 尾 的 字符 串 的 指针 作为 参 
数 ， 返 回 一 个 对 应 的 long 型 整数 值 。 在 下 面 这 些 假设 情况 下 ， 请 写 出 atol 函 数 的 一 
个 可 移植 版 本 。 


。 作为 输入 参数 的 指针 ， 指 向 的 字符 串 总 是 代表 一 个 合法 的 long 型 整数 值 ， 因 
此 atol 函 数 无 须 检查 该 输入 是 否 越界 。 


。 唯一 合法 的 输入 字符 是 数字 和 正 负 号 。 在 遇 到 第 一 个 非法 字符 时 输入 结 
我 们 不 妨 假定 在 机 器 的 排序 序列 中 ， 数 字 是 连续 排列 的 : 任何 一 种 现代 计算 


机 都 是 这 样 实现 的 ， 而 且 ANSI C 标 准 中 也 是 这 样 要 求 的 。 因 此 ， 我 们 面临 的 主要 
问题 就 是 避免 中 间 结 果 发 生 液 出， 即使 最 终 的 结果 在 取 值 范围 之 内 也 是 如 此 。 


正如 printnum 函 数 中 的 情形 ， 如 果 long 型 负数 的 最 小 可 能 取 值 与 正 数 的 最 大 可 
能 取 值 并 不 相 匹 配 ， 问 题 就 变 得 环 手 了 。 特 别 是 如 果 我 们 先 把 一 个 值 作为 正 数 处 
理 ， 然 后 再 使 它 为 负 ， 对 于 负数 的 最 大 可 能 取 值 的 情况 ， 在 很 多 机 器 上 都 会 发 生 
int HH o 


下 面 这 个 版 本 的 atol 函 数 ， 只 使 用 负数 (和 和 零 ) 来 得 到 函数 的 结果 ， 从 而 和 避 
Goa T iih: 


long atol(char *s) { 


long r = ð; 
int neg = @; 
switch(*s) { 
case '-': 
neg = 1; 
/* 此 处 没有 break 语 句 */ 
case '+': 
S++; 
break; 
} 
while (*s >= '@' && *s <= '9') { 
int n = *s++ - '@'; 
if (neg) 
n = -n; 
r=r* 104+n 
} 
return r; 


附录 A printf、varargs 与 stdarg 


本 附录 介绍 了 C 语 言 中 经 常 被 误解 的 3 个 常见 工具 : printf 库 函数 族 、varargs 和 
stdarg 工 具 。 后 两 者 主要 用 于 编写 那些 随 调用 场合 的 不 同 ， 其 参数 的 数目 和 类 型 也 
不 同 的 函数 。 我 经 常见 到 某 些 程序 还 在 使 用 printf 函 数 中 多 年 前 就 已 基本 废弃 不 用 
的 特性 ， 也 见 到 另 一 些 程序 ， 明 明 要 完成 的 任务 利用 varargs 和 stdarg 可 以 做 得 干净 
利落 、 漂 漂亮 亮 ， 但 却 使 用 了 各 种 和 干 奇 百 怪 的 杂凑 招式 ， 而 且 这 些 天 知道 怎么 想 
出 来 的 办 法 并 不 具有 一 般 性 ， 因 而 难于 移植 。 


A.1 printf 2K 
下 面 的 程序 与 我 们 在 第 0 章 中 给 出 的 第 1 个 C 程 序 非常 类 似 : 


#include <stdio.h> 
main() { 

printf( "Hello world\n"); 
} 


这 个 程序 的 输出 是 : 


Hello world 


后 面 跟 一 个 换行 符 Cm) 。 


printf 函 数 的 第 1 个 参数 是 关于 输出 格式 的 说 明 ， 它 是 一 个 描述 了 输出 格式 的 

字符 叫 。 这 个 字符 串 遵循 通常 的 C 语 言 惯例 ， 以 空 字符 〈 即 \0》 结 尾 。 我 们 把 这 个 
字符 串 写成 字符 串 常 量 的 形式 即 用 双 引 号 括 起 来 》， 就 能 够 自动 保证 它 以 空 字 
符 结尾 。 


printf 函 数 把 格式 说 明 字 符 串 中 的 字符 逐一 复制 到 标准 输出 ， 直 到 格式 字符 串 
结束 或 者 遇 到 一 个 % 字 符 。 这 时 ，Pprintf 函 数 并 不 打印 % 字 符 ， 而 是 查看 紧 跟 9% 字 
符 之 后 的 在 干 字符 ， 以 获得 有 关 如 何 转换 其 下 一 个 参数 的 指示 。 转 换 后 的 参数 将 
蔡 换 % 字 符 以 及 其 后 若干 字符 的 位 置 ， 由 printf 函 数 打 印 到 标准 输出 。 因 为 上 例 中 
printf 函 数 的 格式 字符 串 并 没有 包含 % 字 符 ， 因 此 所 输出 的 就 是 格式 字符 串 本 刁 。 
格式 字符 串 以 及 与 之 对 应 的 参数 ， 决 定 了 输出 中 的 每 个 字符 《〈 也 包括 作为 每 行 结 
束 标志 的 换行 符 ) 。 


与 Printf 函 数 同族 的 还 有 两 个 函数 : fprintf 和 sprintf。printf 函 数 是 把 数据 写 到 
标准 输出 ， 而 fprintf 函 数 则 可 以 把 数据 写 到 任何 文件 中 。 需 要 写 入 的 特定 文件 ， 
将 作为 fprintf 函 数 的 第 1 个 参数 ， 它 必须 是 一 个 文件 指针 。 因 此 ， 


printf (stuff); 


从 意义 上 来 说 就 等 效 于 


fprintf(stdout, stuff); 


当 输 出 数据 不 是 被 写 入 一 个 文件 时 ， 我 们 可 以 使 用 sprintf 函 数 。sprintf 函 数 的 
第 1 个 参数 是 一 个 指向 字符 数组 的 指针 ，sprintf 函 数 将 把 其 输出 数据 写 到 这 个 字符 
数组 中 。 编 程 人 员 应 该 确保 这 个 数组 足够 大 以 容纳 sprintf 函 数 押 生成 的 输出 数 
据 。sprintf 函 数 其 余 的 参数 与 printf 函 数 的 参数 相同 。sprintf 函 数 生成 的 输出 数据 总 
是 以 空 字 符 收尾 ， 如 果 希 望 在 输出 数据 中 出 现 一 个 空 字符 ， 我 们 可 以 显 式 地 使 
用 %c 格 式 项 把 它 打印 出 来 。 


这 3 个 函数 的 返回 值 都 是 已 传送 的 字符 数 。 对 于 sprintf 的 情形 ， 作 为 输出 数据 
结束 标志 的 空 字 符 并 不 计 入 总 的 字符 数 。 如 果 printf 或 fprintf 在 试图 写 入 时 出 现 一 
个 IO 错误 ， 将 返回 一 个 负 值 。 在 这 种 情况 下 ， 我 们 就 无 从 得 知 究竟 有 多 少 字 符 已 
经 被 写 出 。 因 为 sprintf 函 数 并 不 进行 O 操 作 ， 所 以 它 不 会 返回 负 值 。 当 然 ， 也 不 
排除 有 的 C 语 言 实现 会 因为 某 种 原因 ， 而 令 sprintf 函 数 返 回 一 个 负 值 。 


因为 格式 字符 串 决 定 了 其 余 参 数 的 类 型 ， 而 且 可 以 到 运行 时 才 建 立 格式 字符 
串 ， 所 以 C 语 言 实现 要 检查 printf 函 数 的 参数 类 型 是 否 正确 是 异常 困难 的 。 如 果 我 
们 像 下 面 这 样 写 : 


printf("%d\n", @.1); 


或 者 


printf("%g\n", 2); 


最 后 得 到 的 结果 可 能 点 无 意义 ， 而 且 在 程序 实际 运行 之 前 ， 这 些 错误 极 有 可 
能 不 会 被 编译 器 检测 到 ， 而 成 为 “漏网 之 鱼 ”。 


大 多 数 C 语 言 实现 都 无 法 检测 出 下 面 的 错误 : 


fprintf("error\n"); 

上 例 中 ， 程 序 员 的 本 意 是 使 用 fprintf 函 数 输出 一 行 出 错 提示 信息 到 stderr， 但 
是 一 时 大 意 息 记 写 stderr， 而 fprintf 函 数 会 把 格式 字符 串 当 作 一 个 文件 结构 来 处 
理 ， 这 种 情况 下 就 很 可 能 出 现 内 核 转 储 的 后 果 ! 


A.1.1 简单 格式 类 型 


格式 字符 串 中 的 每 个 格式 项 都 由 一 个 % 符 号 打头 ， 后 面 接 一 个 称 为 格式 码 的 
字符 ， 格 式 码 指明 了 格式 转换 的 类 型 。 格 式 码 不 一 定 要 紧 跟 在 % 符 号 之 后 ， 它 们 
中 间 可 能 夹 一 些 可 选 的 字符 ， 这 些 可 选 字 符 以 各 种 方式 修改 转换 ， 我 们 将 在 后 面 
详细 讨论 这 些 方式 。 每 个 格式 项 都 是 以 格式 码 结 


最 利用 的 格式 项 肯定 是 %d， 这 个 格式 项 的 含义 是 以 十 进 制 形式 打印 一 个 整 
数 ， 例 如 ， 


printf("2 + 2 = %d\n", 2 + 2); 


将 打印 出 : 


后 面 跟 一 个 换行 符 〈 下 面 的 例子 对 输出 中 换行 符 的 出 现 将 不 再 费 述 ) 。 


9%d 格 式 项 请 求 打印 一 个 整数 ， 因 此 后 面 必须 有 一 个 相应 的 整 型 参数 。 当 格式 
字符 串 被 复制 到 输出 文件 时 ， 其 中 的 %d 格 式 项 将 用 对 应 的 待 输出 整数 的 十 进 制 值 
从 换 ， 蔡 换 时 不 会 在 整数 值 的 前 后 添加 空格 字符 。 如 果 该 整数 是 负 值 ， 输 出 值 的 
第 一 个 字符 就 是 -' 符 号。 


9%6u 格 式 项 与 9%d 格 式 项 类 似 ， 只 不 过 要 求 打印 无 符号 十 进 制 整数 。 因 此 ， 下 


例 中 : 


printf("%u\n", -37); 
将 打印 出 : 


4294967259 


前 提 是 所 在 机 器 上 整数 是 32 位 。 


回忆 一 下 ， 我 们 在 前 面 章节 中 提 到 过 ，char 型 和 short 型 的 参数 会 被 自动 扩展 
为 int 型 。 在 把 char 类 型 的 值 视 为 有 符号 整数 的 机 器 上 ， 这 一 点 经 常会 引起 令 人 吃 
惊 的 后 果 。 例 如 ， 在 这 样 的 机 器 上 ， 


printf("%u\n", c); 


将 打印 出 : 


4294967259 
因为 此 时 字符 型 的 -37 被 转换 成 了 整 型 的 -37。 要 避免 这 一 问题 ， 我 们 应 该 
把 %u 格 式 项 仅 用 于 无 符号 整数 。 


%o、%x 和 %X 格 式 项 用 于 打印 八进制 或 十 六 进 制 的 整数 。%o 格 式 项 请 求 输 
出 八进制 整数 ， 而 %x 和 %X 则 请 求 输出 十 六 进 制 整数 。%x 和 %X 格 式 项 的 唯一 区 
别 就 是 ，%x 格 式 项 中 用 小 写字 母 a、b、c、d、e 和 人 { 瑟 表示 10 一 15 的 数位 值 ， 

而 %X 格 式 项 中 是 用 大 写字 母 A、B、C、D、E 和 F 来 表示 。 八 进 制 和 十 六 进 制 整 
数 总 是 作为 无 符号 数 处 理 。 


我 们 来 看 一 个 例子 : 


int n = 108; 
printf("%d decimal = %o octal = %x hex\n", n, n, n); 


将 打印 出 : 


108 decimal = 154 octal = 6c hex 


如 果 上 例 中 用 %X 人 代替 了 9%x， 那 么 输出 将 变 成 


108 decimal = 154 octal = 6C hex 


9%s 格 式 项 用 于 打印 字符 串 : 与 之 对 应 的 参数 应 该 是 一 个 字符 指针 ， 符 输出 的 
字符 始 于 该 指针 所 指 同 的 地 址 ， 直 到 出 现 一 个 空 字符 〈\0') 才 终 止 。 下 面 是 %s 格 
式 项 的 一 种 可 能 用 法 : 


printf("There %s %d item%s in the list.\n", 
ni=1? "are": "is", n, nl=1? "s": ""); 


上 例 的 第 1 个 %s 格 式 项 ， 将 被 is 或 者 are 蔡 换 ， 第 2 个 %s 格 式 项 ， 将 被 s 或 者 空 
字符 串 蔡 换 。 因 此 ， 如 果 n 是 37， 输 出 将 是 : 


There are 37 items in the list. 


但 是 如 果 n 是 1， 输 出 将 是 : 


There is 1 item in the list. 


%s 格 式 项 所 对 应 输出 的 字符 串 必须 以 一 个 空 人 字符 ONO 作为 结束 标志 《唯一 
的 例外 情况 将 在 后 面 讨论 ) 。 因 为 printf 函 数 要 以 此 来 定位 一 个 字符 串 何 时 结束 ， 
售 此 别 无 他 法 。 如 果 与 %s 对 应 的 字符 串 并 不 是 以 空 字符 〈\0') 作为 结束 标志 ， 那 
么 printf 函 数 将 不 断 打 印 出 其 后 的 字符 ， 直 到 在 内 存 中 某 处 找到 一 个 空 字 符 
(\0') 。 这 种 情况 下 ， 最 终 的 输出 可 能 相当 长 ! 


因为 %s 格 式 项 将 打印 出 对 应 参数 中 的 每 个 字符 ， 所 以 


printf(s); 


与 


printf("%s", s); 


两 者 的 含义 并 不 相同 。 第 1 个 例子 将 把 字符 串 s 中 的 任何 % 字 符 视 为 一 个 格式 
项 的 标志 ， 因 而 其 后 的 字符 会 被 视 为 格式 码 。 如 果 除 %% 之 外 的 任何 格式 码 在 字 
符 串 s 中 出 现 ， 而 后 面 又 没有 对 应 的 参数 ， 将 会 带 来 麻烦 。 而 第 2 个 例子 将 会 打印 
出 任何 以 空 字符 结尾 的 字符 串 。 


因为 一 个 NULL 指 针 并 不 指向 任何 实际 的 内 存 位 置 ， 它 肯定 也 不 可 能 指向 一 
个 字符 串 。 因 此 ， 


printf("%s\n", NULL); 


的 结果 将 难以 预料 。3.5 节 对 这 种 情况 做 了 详细 讨论 。 


9%c 格 式 项 用 于 打印 单个 字符 : 


printf("%c", c); 


putchar(c); 


{A FE BUA ATED EAT oe EET, RSF FE CHU ASE EAE Ft 
中 。 与 %c 格 式 项 对 应 的 参数 是 一 个 为 了 打印 输出 而 被 转换 为 字符 型 的 整 型 值 。 例 
如 : 


printf("The decimal equivalent of '%c' is %d\n", 
gt 。 


3 3 


将 打印 出 : 


The decimal equivalent of '*' is 42 


%g、%f 和 %e 这 3 个 格式 项 用 于 打印 浮 点 值 。%g 格 式 项 在 打印 那些 不 需要 按 
列 对 齐 的 浮 点 数 时 特别 有 用 。 它 在 打印 出 对 应 的 数值 (必须 为 浮 点 型 或 双 精 度 类 
型 ) 时， 会 去 掉 该 数值 尾 级 的 零 ， 保 留 6 位 有 效 数 字 。 因 此 ， 在 我 们 包含 了 math.h 
头 文件 之 局 ， 


printf("Pi = %g\n", 4 * atan(1.0@)); 


将 打印 出 : 


Pi = 3.14159 


而 


printf("%g %g %g %g %g\n", 
1/1.0, 1/2.0, 1/3.0, 1/4.0, 0.0); 


将 打印 出 : 


1 0.5 0.333333 0.25 6 


注意 ， 因 为 一 个 数 中 出 现在 前 面 的 零 对 于 数值 精度 没有 贡献 ， 所 以 在 
0.333333 中 会 有 6 个 3。 输 出 的 数值 被 四 舍 五 入 ， 而 不 是 直接 截断 : 


[printf("%g\n", 2.0 / 3.0); 


将 打印 出 : 


0.666667 


如 果 一 个 数 的 绝对 值 大 于 999999， 按 %g 的 格式 打印 出 这 个 数 就 会 面临 一 个 两 
难 选择 : 要 么 需要 打印 出 超过 6 位 的 有 效 数 字 ， 要 么 打印 出 的 是 一 个 不 正确 的 
值 。%g 格 式 项 解决 这 个 难题 的 方式 是 ， 采 用 科学 计数 法 来 打印 这 样 的 数值 : 


printf("%g\n", 123456789.0); 


将 打印 出 : 


1.23457e+08 


我 们 看 到 ， 这 个 数 在 用 科学 计数 法 来 表示 时 ， 被 四 售 五 入 到 6 位 有 效 数 字 。 


当 一 个 数 的 绝对 值 很 小 时 ， 要 表示 这 个 数 所 需要 的 字符 数目 就 会 多 到 让 人 难 
于 接受 。 举 例 而 言 ， 如 果 我 们 把 xnx10-19 写 作 0.000000000314159 就 显得 非常 丑陋 不 
雅 ， 反 之 ， 如 果 我 们 写作 3.14159e-10， 就 不 但 简洁 而 且 易 读 好 懂 。 当 指数 是 -4 
时 ， 这 两 种 表现 形式 的 长 度 就 恰好 相等 。 例 如 ，0.000314159 与 3.14159e-04 所 占用 
的 空间 大 小 相同 。 对 于 比较 小 的 数值 ， 除 非 该 数 的 指数 小 于 或 等 于 -5，%g 格 式 项 
才 会 采用 科学 计数 法 来 表示 。 因 此 ， 


printf("%g %g %g\n", 3.14159e-3, 3.14159e-4, 3.14159e-5); 


将 打印 出 : 


@.00314159 @.000314159 3.14159e-65 


%e 格 式 项 用 于 打印 浮 点 数 时 ， 要 求 一 律 显 式 地 使 用 指数 形式 : r 在 使 用 %e 格 
式 项 时 将 被 写成 3.141593e+00。%e 格 式 项 将 打印 出 小 数 点 后 6 位 有 效 数字 ， 而 并 
非 如 %g 格 式 项 那样 打印 出 的 数 是 总 共 6 位 有 效 数 字 。 


%f 格 式 项 则 恰好 相反 ， 它 强制 禁止 使 用 指数 形式 来 表示 浮 点 数 ， 因 此 nt 就 被 
写成 3.141593。 在 数值 精度 方面 ，%f 格 式 项 的 要 求 与 %e 格 式 项 相同 ， 即 小 数 点 后 
6 位 有 效 数 字 。 因 此 ， 一 个 非常 小 的 数值 即使 不 是 09， 看 上 去 也 会 与 0 差不多 ; 而 
一 个 很 大 的 数值 ， 看 上 去 就 会 是 一 大 堆 数 字 : 


printf("%Ff\n", 1238); 


将 打印 出 : 


[106000000000000000000000000000000000060. 000000 


这 个 例子 中 打印 出 的 数值 的 数字 位 数 ， 超 过 了 大 多 数 硬件 能 够 表示 的 精度 范 
围 ， 因 此 对 于 不 同 的 机 器 最 终 的 结果 也 随 之 不 同 。 


%E 和 %G 格 式 项 与 它们 对 应 的 %e 和 %g 格 式 项 在 行为 方式 上 基本 相同 ， 除 了 
用 大 写 的 E 代 人 玲 了 小 写 的 e 来 表示 指数 形式 。 


%% 格 式 项 用 于 打印 出 一 个 % 字 符 。 这 个 格式 项 的 独特 之 处 在 于 它 不 需要 一 
个 对 应 的 参数 。 因 此 ， 下 面 的 语句 


printf("%%d prints a decimal value\n"); 


将 打印 出 : 
%d prints a decimal value 


A.1.2 ”修饰 符 


printf 疯 数 也 接受 辅助 字符 来 修饰 一 个 格式 项 的 含义 。 这 些 辅 助 字符 出 现在 % 
符号 和 后 面 的 格式 码 之 间 。 


整数 有 3 种 不 同类 型 ， 对 应 3 种 不 同 长 度 : short、long 和 正常 长 度 。 如 果 一 个 
short 整 数 作为 任何 一 个 函数 (也 包括 printf 函 数 ) 的 参数 出 现 ， 它 会 被 自动 地 扩展 
为 一 个 正常 长 度 的 整数 。 但 是 ， 我 们 仍然 需要 一 种 方式 ， 来 通知 printf 函 数 茶 个 参 
数 是 long 型 整数 。 我 们 可 以 在 格式 码 之 前 紧 挨 着 插入 一 个 长 度 修饰 符 !， 创 造 
出 %ld、%lo、%Ix 和 %lu 等 新 的 格式 码 。 这 些 前 面 加 了 修饰 符 的 格式 码 与 不 加 修饰 
符 的 格式 码 在 行为 方式 上 完全 相同 ， 只 是 它们 要 求 long 型 整数 作为 其 对 应 参数 。 
即使 在 小 部 分 不 直接 支持 long unsigned 类 型 数值 的 C 语 言 实 现 上 ，%lu 格 式 项 仍然 
会 把 long 型 整数 当 作 long 型 无 符号 整数 打印 出 来 。] 修 饰 符 只 对 用 于 整数 的 格式 码 
有 意义 。 


许多 C 语 言 实现 以 同样 的 精度 存储 int 型 和 long 型 的 数值 。 在 这 种 机 器 上 ， 如 


果 环 记 使 用 ] 修 饰 符 ， 将 不 会 被 检测 到 ， 只 有 当 程 序 被 移植 到 另 一 种 int 型 和 long 型 
有 真正 区 别 的 机 器 上 时 ， 错 误 才 会 暴露 出 来 。 因 此 ， 例 如 ; 


long size; 


printf("%d\n", size); 


在 茶 些 机 器 上 能 够 工作 ， 而 在 男 一 些 机 器 上 却 无 法 工作 。 


利用 宽度 修饰 符 ， 我 们 可 以 轻松 做 到 在 固定 长 度 的 域内 打印 数值 。 宽 度 修饰 
符 出 现在 % 符 号 和 格式 码 的 中 间 ， 其 作用 是 指定 它 所 修饰 的 格式 项 所 应 打印 的 字 
符 数 。 如 果 待 打印 的 数值 不 能 填 满 位 置 ， 它 的 左 侧 就 会 被 补 上 空格 字符 以 使 这 个 
数值 的 宽度 满足 要 求 。 如 果 符 打印 的 数值 太 大 而 超过 了 给 定 的 域 宽 ， 输 出 域 就 会 
适当 地 调整 以 容纳 该 数值 。 宽 度 修饰 符 绝对 不 会 截断 一 个 输出 域 。 当 我 们 使 用 宽 
度 修饰 符 来 按 列 对 齐 一 组 数字 时 ， 如 果 一 个 数值 太 大 而 不 能 被 它 所 在 的 栏 所 容 
纳 ， 那 么 它 就 会 挤占 同一 行 右 侧 紧邻 数值 的 位 置 。 


下 面 这 段 代 码 : 


int i; 
for (i = ð; i <= 10; i++) 
printf("%2d %2d *\n", i , i*i); 


将 生成 以 下 输出 : 


URW OPO 


NB 
ma 上 Fe 


* * * *¥* * ¥ 


6 36 * 
7 49 * 
8 64 * 
9 81 * 
10 100 * 


上 例 中 的 * 用 于 标识 一 行 的 结束 。 数 值 100 需 要 3 个 字符 才能 完整 显示 ， 而 宽 


度 修 饰 符 指定 的 是 2 字符 的 域 宽 ， 因 此 它 所 在 的 域 将 会 被 自动 扩展 ， 而 同一 行 后 
面 的 部 分 将 依次 右 移 。 


宽度 修饰 符 对 所 有 的 格式 码 都 有 效 ， 甚 至 %% 也 不 例外 。 因 此 ， 例 如 : 
printf("%8%\n") ; 


将 在 一 个 宽度 为 8 字符 的 域 中 以 右 对 齐 的 方式 打印 出 一 个 % 符 号 。 换 言 之 ， 就 
是 先 打印 出 7 个 空格 字符 ， 然 后 紧 跟着 打印 一 个 % 符 号 。 


精度 修饰 符 的 作用 是 控制 一 个 数值 的 表示 中 将 要 出 现 的 数字 位 数 ， 或 者 用 于 
限制 将 要 打印 的 字符 串 中 应 该 出 现 的 字符 数 。 精 度 修饰 符 包括 一 个 小 数 点 和 小 数 
点 后 面 的 一 串 数字 。 精 度 修饰 符 出 现在 % 符 号 和 宽度 修饰 符 之 后 ， 格 式 码 与 长 度 
修饰 符 之 前 。 精 度 修饰 符 的 确切 含义 与 格式 码 有 关 。 

。 对 于 整数 格式 项 %d、%o、%x 和 %u， 精 度 修饰 符 指定 了 打印 数字 的 最 少 位 


数 。 如 果 符 打印 的 数值 并 不 需要 这 么 多 位 数 的 数字 来 表示 ， 就 会 在 它 的 前 面 
补 上 0。 因 此 ， 


printf("%.2d/%.2d/%.4d\n", 7, 14, 1789); 


将 打印 出 : 


07/14/1789 


。 对 于 9%e、9%6E 和 9%6f 格 式 项 ， 精 度 修饰 符 指定 了 小 数 点 后 应 该 出 现 的 数字 位 
数 。 除 非 标志 〈Flag， 我 们 马上 将 讨论 到 ) 另 有 说 明 ， 和 否则 仅 当 精度 大 于 0 时 
打印 的 数值 中 才 会 实际 出 现 小数 点 。 因 此 ， 当 我 们 包含 了 math.h 头 文件 之 
后 : 


double pi; 


pi = 4 * atan(1.0); 
printf("%.0f %.1f %.2f %.3f %.6f %.10f\n", 


pi, pi, pi, pi, pi, pi); 
printf("%.@e %.1e %.2e %.10e\n", 


pi, pi, pi, pi, pi, pi); 


将 打印 出 : 


3 3.1 3.14 3.142 3.141593 3.1415926536 
3e+06 3.1e+00 3.14e+00 3.1415926536e+00 


对 于 %g 和 %G 格 式 项 ， 精 度 修饰 符 指定 了 打印 数值 中 的 有 效 数 字 位 数 。 除 非 
标志 另 有 说 明 ， 人 否则 非 有 效 数 字 的 0 将 被 去 兵 。 如 果 小 数 点 后 不 跟 数 字 ， 则 小 
数 点 也 将 被 删除 。 


printf("%.1g %.2g %.4g %.8g\n", 


10/3.@, 10/3.0, 10/3.0, 10/3.2); 


将 生成 以 下 输出 : 


3 3.3 3.333 3.3333333 


对 于 %s 格 式 项 ， 精 度 修饰 符 指定 了 将 要 从 相应 的 字符 串 中 打印 的 字符 数 。 如 
果 该 字符 串 中 包含 的 字符 数 少 于 精度 修饰 符 所 指定 的 字符 数 ， 输 出 的 字符 数 
就 会 少 于 精度 修饰 符 指 定 的 数目 。 如 果 需 要 ， 我 们 可 以 通过 域 宽 修饰 符 来 加 
长 输出 。 

在 茶 些 系统 中 ， 文 件 名 组 件 被 存储 在 一 个 包含 有 14 个 字符 元 素 的 数组 中 。 如 
果 组 件 名 少 于 14 个 字符 ， 那 么 数组 的 剩余 部 分 将 被 空 字 符 填充 ; 但是， 如果 
组 件 名 恰好 为 14 个 字符 ， 数 组 将 被 完全 占用 ， 没 有 一 个 空 字符 来 作为 结束 标 
志 。 要 打印 这 样 的 文件 名 ， 应 该 表示 为 如 下 样式 : 


char name[14]; 


printf("... %.14s ...", ..., mame, ...); 


这 样 做 就 保证 了 无 论文 件 名 有 多 长 ， 它 总 能 够 被 正确 地 打印 输出 。 使 
用 %14.14s 格 式 项 ， 将 确保 打印 出 14 个 字符 ， 而 不 管 文 件 名 的 长 度 究 竟 如 何 
《如 果 有 必要 ， 将 在 文件 名 的 左 侧 填补 空白 字符 以 达到 14 个 字符 ; 至 于 如 何 
在 右 侧 填补 ， 我 们 马上 将 要 讲 到 ) 。 


© 对 于 %c 和 %% 格 式 项 ， 精 度 修饰 符 将 被 忽略 。 
A.1.3 标志 


我 们 可 以 在 % 符 号 和 域 宽 修饰 符 之 间 插 入 标志 字符 ， 以 微调 格式 项 的 效果 。 
标志 字符 以 及 它们 的 含义 如 下 。 


。 在 显示 宽度 大 于 被 显示 位 数 时 ， 数 据 尾部 都 以 显示 区 的 右 端 对 齐 ， 左 端 则 被 
填充 空白 字符 。 标 志 字 符 - 的 作用 是 ， 要 求 显示 方式 改 为 左 端 对 齐 ， 在 右 端 填 
充 空 白字 符 。 因 此 ， 仅 当 域 宽 修 饰 符 存在 时 ， 标 志 字 符 - 才 有 意义 〈 人 否则， 填 
充 空 白字 符 就 无 从 说 起 ) 。 

要 在 固定 栏 内 打印 字符 串 ， 一 般 来 说 ， 左 端 对 齐 的 形式 看 上 去 要 美观 整齐 一 
扩 。 因 此 ， 类 似 于 %14s 这 样 的 格式 项 可 能 并 不 正确 ， 而 应 该 写作 %-14s。 前 
面 的 例子 如 果 稍 作 改动 ， 得 到 的 结果 会 更 赏心悦目 一 些 : 


char name[14]; 


printf(".. 


标志 字符 + 的 作用 是 ， 规 定 每 个 竺 打印 的 数值 在 输出 时 都 应 该 以 它 的 符号 〈 正 
ee lia te ci aa 应 该 在 最 前 面 有 一 
个 正 号 。 标 志 字 符 + 与 标志 字符 之 间 不 存在 任何 联系 。 


printf("%+d %+d %+d\n", -5, ©, 5); 


将 生成 以 下 输出 : 


seas eee 


空白 字符 作为 标志 字符 时 ， 它 的 含义 是 : 如 果 某 数 是 一 个 非 负 数 ， 就 在 它 的 
前 面 插入 一 个 空白 字符 。 如 果 我 们 希望 让 固定 栏 内 的 数值 向 左 对 齐 ， 而 又 不 
想 用 标志 字符 +， 这 一 点 就 特别 有 用 。 如 果 标 志 字 符 + 与 空白 字符 同时 出 现在 
一 个 格式 项 中 ， 最 终 的 效果 以 标志 字符 + 为 准 。 例 如 : 


int i; 
for (i = -3; i <= 3; i++) 


printf("% d\n", i); 


将 打印 出 : 


如 果 我 们 希望 在 固定 栏 内 按 科学 计数 法 打印 数值 ， 格 式 项 % e 和 9%+e 要 比 
正常 的 格式 项 %e 有 用 得 多 。 因 为 这 时 出 现在 非 负 数 前 面 的 正 号 《或 者 空白 ) 
保证 了 所 有 输出 数值 的 小 数 点 都 会 对 齐 。 例 如 : 


double x; 
for (x = -3; x <= 3; X++) 


printf("% e %+e %e\n", x, X, xX); 


将 打印 出 : 


-3.000000e+000 -3.000000e+000 -3.000000e+000 


-2.000000e+000 -2.990000e+000 -2.900000e+000 
-1.000000e+000 -1.990000e+000 -1.900000e+000 
0.000000e+000 +0.000000e+000 28.900000e+000 
1.000000e+000 +1.000000e+000 1.000000c+000 
2.000000e+000 +2.000000e+000 2.0900000e+000 
3.000000e+000 +3.000000e+000 3.0900000e+000 


我 们 注意 到 ， 按 %e 格 式 项 打印 出 来 的 最 后 一 列 数值 的 小 数 点 并 没有 正确 
地 对 齐 ， 而 按 男 外 两 个 格式 项 打印 出 来 的 前 两 列 数值 的 小 数 点 就 对 齐 了 。 


标志 字符 # 的 作用 是 对 数值 输出 的 格式 进行 微调 ， 具 体 的 方式 与 特定 格式 项 有 
关 。 给 %o 格 式 项 加 上 标志 字符 # 的 效果 是 : 当 有 必要 时 增加 数值 输出 的 精度 
(只 需 让 输出 的 第 1 个 数字 为 0 就 已 经 做 到 了 ) 。 这 么 规定 的 意义 在 于 ， 让 八 
进 制 数 值 输出 的 格式 与 大 多 数 C 程 序 员 惯用 的 形式 一 致 。%#o 与 0%o 并 不 相 
同 ， 因 为 0%o 把 数值 0 打印 成 00， 而 %#o 的 打印 结果 是 0。 同 理 ， 格 式 项 %#x 
与 %#X 要 求 打 印 出 来 的 十 六 进 制 数值 前 面 分 别 加 上 0x 或 0X。 

标志 字符 # 对 浮 点 数 格式 的 影响 有 两 方面 : 其 一 ， 它 要 求 小 数 点 必须 被 打印 出 
来 ， 即 使 小 数 点 后 没有 数字 也 是 如 此 ;其 二 ， 如 果 用 于 %g 或 %G 格 式 项 ， 打 
印 出 的 数值 尾 级 的 0 将 不 会 被 去 掉 。 例 如 : 


printf("%.6f %#.0f %g %#g\n", 


3.0, 3.0, 3.0, 3.0); 


将 打印 出 : 


3 3. 3 3.00000 


除了 + 和 空白 字符 ， 其 余 的 标志 字符 都 是 各 自 独 立 的 。 


A.1.4 可 变 域 宽 与 精度 


在 部 分 C 程 序 中 ， 某 些 字符 数组 的 长 度 补 有意 地 定义 为 一 个 显 式 常量 
(manifest constant) 。 这 样 ， 如 果 数 组 长 度 有 变动 ， 只 需要 改动 一 处 即 可 。 但 
是 ， 在 需要 打印 字符 数组 的 长 度 时 ， 又 只 能 在 程序 中 把 它 写成 整数 常量 〈 这 种 在 
程序 中 写 “ 死 ”的 数字 ， 一 般 称 为 magic number) 。 由 此 ， 我 们 此 前 提 到 的 那个 例 
子 ， 可 能 被 写成 下 面 这 样 : 


#define NAMESIZE 14 
char name[NAMESIZE]; 


printf("... %.14s ...", ..., mame, ...); 


这 样 做 实在 是 不 智之 举 。 我 们 定义 NAMESIZE 的 目的 就 是 希望 只 需要 在 一 处 
提 及 14 这 个 数值 。 而 像 这 样 写 ， 当 改动 NAMESIZE 之 后 ， 我 们 还 需要 搜索 每 个 
printf 疯 数 调 用 的 地 方 以 找到 要 更 改 的 数值 ， 而 这 恰恰 是 最 容易 遗忘 或 忽视 的 地 
方 。 然 而 ， 我 们 又 不 能 够 在 printf 函 数 调 用 中 直接 使 用 NAMESIZE: 


printf("... %.NAMESIZE ...", ... , name, ...); 


EG AFAR A KATA Sa BYE H Ye ES) AS BS BS A A 


考虑 到 这 些 ，printft 函 数 因 此 允许 间接 指定 域 宽 和 精度 。 要 做 到 这 一 点 ， 我 们 
只 需 用 * 蔡 换 域 宽 修 饰 符 或 精度 修饰 符 其 中 之 一 ， 或 者 两 者 都 蔡 换 。 在 这 种 情况 
下 ，Pprintf 函 数 首先 从 参数 列表 中 取得 将 要 使 用 的 域 宽 或 精度 的 实际 数值 ， 然 后 使 
用 该 数值 来 完成 打印 任务 。 因 此 ， 上 面 的 例子 可 以 写成 这 样 : 


printf("... %.*s ...", ... , NAMESIZE, name, ...); 


BOR RATE A * E h E Ra eB TT SR AT, ABA Je TH HB ep 
将 依次 出 现代 表 域 宽 的 参数 、 代 表 精 度 的 参数 以 及 代表 要 打印 的 值 的 参数 。 因 
此 ， 


printf("%*.*s\n", 12, 5, str); 


与 下 式 完全 等 效 


printf("%12.5s\n", str); 

这 个 式 子 将 打印 出 字符 串 str 的 前 5 个 字符 〈 或 者 更 少 ， 如 果 strlen(s) <5) ， 前 
面 将 填充 知 干 空白 字符 以 达到 总 共 打 印 12 个 字符 的 要 求 。 下 面 这 个 例子 鲜 有 人 能 
够 说 明 其 含义 : 


printf("%*%\n", n); 


上 式 将 在 宽度 为 n 个 字符 的 域内 以 右 端 对 齐 的 方式 打印 出 一 个 % 符 号 ， 换 言 
之 ， 就 是 先 打印 n-1 个 空白 字符 ， 后 面 再 跟 一 个 %% 符 号 。 
如 果 * 用 于 符 换 域 宽 修 饰 符 ， 而 与 其 对 应 的 参数 的 值 为 负数 ， 那 么 效果 相当 


于 把 负 号 作为 -标志 字符 来 处 理 。 因 此 ， 上 例 中 如 果 n 为 负数 ， 输 出 结果 首先 是 一 
个 %% 符 号 ， 后 面 再 跟 -n-1 个 空格 《〈 原 书 为 1-n， 锋 此 处 有 误 ) 。 


A.1.5 新 增 的 格式 码 


ANSI C 标 准 的 定义 中 新 增 了 两 个 格式 码 : %p 和 %n。%p 用 于 以 某 种 形式 打 
印 一 个 指针 ， 上 有 具体 的 形式 与 特定 的 C 语 言 实现 有 关 〔 译 注 : 一 般 是 打印 出 该 指针 
所 指向 的 地 址 ) 。%n 用 于 指出 已 经 打印 的 字符 数 ， 这 个 数 被 存储 在 对 应 参数 
(一 个 整 型 指针 ) 所 指向 的 整数 中 。 执 行 完 以 下 代码 之 后 ， 


int n; 


printf("hello\n%n", &n); 


n 的 值 就 是 6。 


A.1.6 废止 的 格式 码 


随 着 时 间 的 推移 ，printf 函 数 的 有 些 特性 也 逐渐 消亡 。 但 仍 有 一 些 C 语 言 实 


现 ， 还 对 它们 提供 支持 。 


%D 和 %O 格 式 项 曾经 与 %ld 和 %lo 的 含义 相同 。 不 仅 于 此 ，%X 格 式 项 
与 %Jx 格 式 项 也 一 度 有 相同 的 含义 。 后 来 人 们 考虑 到 , “能 够 以 大 写字 母 打 印 十 六 
进 制 的 数值 ?这 一 特性 要 更 为 有 用 ， 因 此 %X 的 含义 就 被 改 成 了 现在 这 个 样子 。 同 
时 ，%D 和 %O 格 式 项 也 被 上 废止 了 。 


过 去 ， 要 打印 一 个 数值 并 在 它 前 面 填充 0， 唯 一 的 办 法 就 是 使 用 标志 字符 0。 
标志 字符 0 的 作用 是 指定 得 打印 的 数值 前 应 该 填充 0 而 不 是 空白 字符 。 因 此 ， 


printf("%@6d %@6d\n", -37, 37); 


将 打印 出 : 


-00037 000037 

然而 ， 当 我 们 要 打印 十 六 进 制 的 数值 或 希望 左 端 对 齐 时 ， 如 果 还 采用 这 种 定 
义 方式 ， 那 么 各 种 因 系 交错 在 一 起 就 会 得 到 相当 “怪异 ”的 结果 。 其 实 ， 我 们 完全 
可 以 采用 一 种 更 好 的 方式 ， 即 使 用 精度 修饰 符 : 


printf("%.6d %.6d\n", -37, 37); 


将 打印 出 : 


-000037 000037 


在 大 多 数 场合 ， 我 们 都 可 以 用 %%. 来 蔡 换 中 0， 效 果 也 非常 接近 。 


A.2 使 用 varargs.h 来 实现 可 变 参数 列表 


在 编写 C 程 序 的 过 程 中 ， 随 着 程序 规模 的 增 大 ， 程 序 员 经 常 感到 有 必要 进行 
系统 化 的 错误 处 理 。 很 自然 可 以 想到 一 个 办 法 ， 就 是 创建 一 个 函数 ， 不 妨 称 之 为 


error， 调 用 的 参数 顺序 与 printf 相 同 ， 因 此 ， 


error("%d is out of bounds", x); 


就 与 下 式 等 效 


fprintf(stderr, "error: %d is out of bounds\n", x); 
exit(1); 


ESE LIX PE — ARA DA ce ETT 8, EAP) a EAE T RA]: 
error 函 数 的 参数 数目 与 类 型 在 不 同 的 调用 间 并 非 一 成 不 变 ， 而 是 像 printf 函 数 那 样 
可 能 随 调用 的 不 同 而 变动 。 一 个 典型 的 解决 之 道 是 把 error 函 数 写成 像 下 面 这 样 ， 
可 惜 这 种 做 法 并 不 正确 : 


void error(a, b, c, d, e, f, g, h, i, j, k) 


fprintf(stderr, "error: "); 

fprintf(stderr, a, b, c, d, e, f, g, h, i, j, k); 
fprintf(stderr, "\n"); 

exit(1); 


编程 人 员 的 想法 是 通过 函数 error 的 参数 列表 来 搜集 一 组 必要 的 数据 ， 然 后 将 
其 传递 给 fprintf 函 数 。 因 为 参数 a 到 k 并 没有 声明 ， 所 以 它们 默认 为 int 类 型 。 当 
然 ，error 图 数 至 少 包 括 了 一 个 非 int 类 型 的 参数 〈 即 格式 字符 串 ) 。 因 此 ， 这 个 程 
序 能 否 工作 就 依赖 于 是 否 可 以 使 用 一 组 整 型 参数 来 复制 任意 类 型 的 数值 。 


在 菜 些 机 器 上 ， 我 们 无 法 做 到 这 一 点 。 即 使 可 以 做 到 ， 效 果 也 是 有 限 的 : 如 
果 error 函 数 的 参数 足够 多 《比如 ， 超 过 上 例 中 的 11 个 ) ， 某 些 参数 肯定 要 丢失 。 
但 是 ， 既 然 printf 函 数 能 够 做 得 到 ， 那 么 必定 存在 一 种 办 法 ， 可 以 传递 可 变 参 数列 


表 给 一 个 函数 。 


printf 疯 数 的 第 1 个 参数 必须 是 一 个 字符 串 ， 我 们 可 以 通过 检查 这 个 字符 串 来 
得 到 其 他 参数 的 数目 与 类 型 (当然 ， 假 定 对 printf 函 数 的 调用 是 正确 的 ) 。 这 一 事 
实 使 得 printf 函 数 实现 可 变 参数 列表 的 难度 大 大 降低 了 。 我 们 需要 做 的 就 是 找到 
printf 函 数 用 以 存 取 变 长 参数 列表 的 机 制 。 


为 了 便于 printf 函 数 的 实现 ， 这 样 一 种 机 制 应 该 拥有 以 下 特性 。 


。 只 需要 知道 函数 的 第 1 个 参数 的 类 型 ， 就 可 以 对 其 进行 存 取 。 
。 一 旦 第 n 个 参数 被 成 功 地 存 取 ， 第 n+1 个 参数 就 可 以 在 仅 知道 类 型 的 情况 下 进 
行 存 取 。 

。 按 这 种 方式 存 取 一 个 参数 所 需 的 时 间 不 应 太 多 。 
需要 特别 注意 的 是 ， 逆 向 存 取 参 数 ， 或 者 随机 存 取 参数 ， 或 者 以 任何 非 从 头 

到 尾 的 顺序 方式 来 存 了 参数， 都 是 不 必要 的 。 进 一 步 来 说 ， 检 测 参数 列表 是 否 结 
束 通常 既 不 必要 ， 也 不 可 能 


大 多 数 C 语 言 实现 都 是 通过 一 组 总 称 为 varargs 的 宏 定 义 来 达到 上 述 目的 。 
些 宏 的 确切 性 质 虽 然 与 特定 的 C 语 言 实 现 有 关 ， 但 是 只 
当 ， 还 是 能 够 在 相当 多 的 机 器 上 使 用 可 变 参数 列表 。 


任何 一 个 程序 ， 只 要 用 到 varargs 中 的 宏 ， 就 应 该 像 下 面 这 样 : 


#include <varargs.h> 


以 在 程序 中 把 相关 的 宏 定 义 包括 进来 。varargs.h 头 文件 中 定义 了 宏 名 va_list、 
va_dcl、va_start、va_end 以 及 va_arg。va_alist 一 般 由 编程 人 员 来 定义 ， 我 们 马上 
将 讨论 如 何 来 做 。 需 要 强调 的 是 ， 应 该 避免 混淆 va_list 与 va_alist。 


任何 一 个 C 语 言 实现 中 ， 对 于 可 变 参数 列表 的 第 n 个 参数 ， 在 已 知 其 类 型 的 情 
况 下 要 对 其 进行 存 取 ， 还 需要 一 些 额 外 的 信息 。 这 些 信息 是 通过 已 经 可 以 存 取 的 


第 1 个 参数 到 第 n 1 个 参数 而 间接 得 到 的 ， 可 以 把 它 看 作 一 个 指向 参数 列表 内 部 的 
指针 。 当 然 ， 在 茶 些 机 器 上 具体 的 实现 可 能 要 复杂 得 多 。 


这 些 信 息 存 储 在 一 个 类 型 为 va_list 的 对 象 中 。 因 此 ， 当 声明 了 一 个 名 称 为 ap 
的 类 型 为 va_list 的 对 象 后 ， 我 们 只 需要 给 定 ap 与 第 1 个 参数 的 类 型 ， 就 可 以 确定 第 
1 个 参数 的 值 。 


通过 va_list 存 取 一 个 参数 之 后 ，va_list 将 被 更 新 ， 指 向 参数 列表 中 的 下 一 个 参 
数 。 


因为 一 个 va_list 中 包括 了 存 取 全 部 参数 的 所 有 必要 信息 ， 所 以 函数 f 以 为 它 
的 参数 创建 一 个 va_list， 然 后 把 它 传递 给 另 一 个 函数 g。 这 样 ， 函 数 g 就 能 够 访问 
到 函数 { 的 参数 。 


例如 ， 在 许多 C 语 言 实 现 中 ，printf 函 数 族 中 的 3 个 函数 〈printf、fprintf 和 
sprintf) ， 它 们 都 调用 了 一 个 公共 的 子 函 数 。 而 对 这 个 子 函 数 来 说 ， 获 取 它 的 调 
用 函数 的 参数 就 很 重要 。 


被 调用 时 带 有 可 变 参数 列表 的 函数 ， 必 须 在 函数 定义 的 首部 使 用 va_alist 和 
va_dcl 宏 ， 如 下 所 示 : 


#include <varargs.h> 
void error (va_alist) va_dcl 
宏 va_alist 将 扩展 为 特定 C 实 现 所 要 求 的 参数 列表 ， 这 样 函 数 就 能 够 处 理 变 长 


参数 ， 而 宏 va_dcl 将 扩展 为 与 参数 列表 对 应 的 声明 ， 必 要 时 还 包括 一 个 作为 语句 


结束 标志 的 分 号 。 


我 们 的 error 函 数 必须 创建 一 个 va_list 变 量 ， 把 变量 名 传递 给 宏 va_start 来 初始 
化 该 变量 。 这 样 做 之 后 ， 就 可 以 逐个 读 取 error 函 数 的 参数 列表 中 的 参数 了 。 当 程 
序 不 再 用 到 参数 列表 中 的 参数 时 ， 我 们 必须 以 va_list 变 量 名 为 参数 来 调用 宏 


va_end， 表 示 不 再 需要 用 到 va_list 变 量 了 。 


我 们 的 error 函 数 于 是 进一步 扩展 为 : 


#include <varargs.h> 
void error (va_alist) va dcl 
{ 
va_list ap; 
va_start(ap); 
// 这 里 是 使 用 ap 的 程序 部 分 
va_end(ap); 
// 这 里 是 不 使 用 ap 的 其 他 程序 部 分 
} 


我 们 务必 记 住 ， 在 使 用 完 va_list 变 量 后 一 定 要 调用 宏 va_end。 在 大 多 数 C 实 现 
中 ， 调 用 va_end 与 否 并 无 区 别 。 但 是 ， 某 些 版 本 的 va_start 宏 为 了 方便 对 va_list 进 
行 遍 历 ， 会 给 参数 列表 动态 分 配 内 存 。 这 样 一 种 C 实 现 很 可 能 利用 va_end 宏 来 释 
放 此 前 动态 分 配 的 内 存 ， 如 果 忘 记 调用 宏 va_end， 最 后 得 到 的 程序 可 能 在 某 些 机 
器 上 没有 什么 问题 ， 而 在 男 一 些 机 器 上 则 发 生 “ 内 存 泄 漏 ”。 


宏 va_arg 用 于 对 一 个 参数 进行 存 取 。 它 的 两 个 参数 分 别 为 va_list 变 量 名 和 希望 
存 取 的 参数 的 数据 类 型 。va_list 宏 将 取得 这 个 参数 ， 并 更 新 va_list 变 量 ， 使 其 指向 
下 一 个 参数 。 因 此 ， 我 们 的 error 函 数 现在 看 上 去 成 了 下 面 这 个 样子 : 


#include <varargs.h> 
void error (va_alist) va dcl 


{ 


va_list ap; 
char *format; 


va_start(ap); 
format = va_arg(ap, char *); 
fprintf(stderr, "error: "); 


//(do something magic) // 某 些 实现 方式 暂时 未 知 的 工作 


va_end(ap); 
fprintf(stderr, "\n"); 
exit(1); 


现在 我 们 暂时 受阻 了 : 没有 办 法 让 printf 函 数 接受 一 个 va_list 变 量 作为 参数 。 
我 们 又 确实 需要 做 到 这 一 点 ， 正 如 “do something magic( 某 些 实现 方式 暂时 未 知 
的 工作 ) ”的 注释 所 表明 的 那样 ， 但 是 如 何 能 做 到 呢 ? 


Aig hse, ANSI C 标 准 要 求 ， 而 且 很 多 C 语 言 实 现 也 提供 了 分 别称 为 
vprintf、vfprintf 和 vsprintf 的 函数 。 这 些 函 数 与 对 应 的 printf 函 数 族 中 的 函数 在 行为 
方式 上 完全 相同 ， 只 不 过 用 va_list 蔡 换 了 格式 字符 串 后 的 参数 序列 。 这 些 函数 之 
所 以 能 够 存在 ， 理 由 有 两 个 : 其 一 ，va_list 变 量 可 以 作为 参数 传递 其 二 ，va_arg 
宏 可 以 独立 出 现在 一 个 函数 中 ， 并 不 强制 要 求 与 va_start 宏 〈 该 宏 的 作用 是 初始 化 
va_list 变 量 ) 成 对 使 用 。 


因此 ，error 函 数 的 最 终 版 本 如 下 所 示 : 


#include <stdio.h> 
#include <varargs.h> 
void error (va_alist) va_dcl 


{ 


va_list ap; 
char *format; 


va_start(ap); 

format = va_arg(ap, char *); 

fprintf(stderr, "error: "); 

vfprintf(stderr, format, ap); 

va_end(ap); 

fprintf(stderr, "\n"); 
exit(1); 


下 面 还 有 一 个 例子 ， ee em hs 
式 。 注 意 ， 不 要 瑟 记 保存 vprintf 函 数 的 结果 ， 我 们 需要 把 这 个 结果 返回 给 printf 函 
数 的 调用 方 。 


#include <varargs.h> 
int printf(va_alist) va _dcl 
va_list ap; 


char *format; 
int n; 


va_start(ap); 

format = va_arg(ap, char *); 
n = vprintf(format, ap); 
va_end(ap); 

return n; 


A.2.1 实现 varargs.h 


varargs.h 的 一 个 典型 实现 包括 一 组 宏 以 及 一 个 va_list 的 typedef 声 明 : 


typedef char *va list; 
#define va_dcl int va_alist; 
#define va_start(list) list = (char *)&va_alist 
#define va_end(list) 
#define va_arg(list,mode) \ 
((mode *) (list += sizeof(mode)))[-1] 


我 们 首先 注意 到 ， 在 这 个 版 本 的 varargs.h 中 ，va_alist 甚 至 不 是 一 个 宏 : 
#include <varargs.h> 
void error (va_alist) va dcl 

将 扩展 为 : 


typedef char *va list; 
void error (va alist) int va_alist; 


因此 ， 一 个 接受 可 变 参 数列 表 的 函数 表面 上 看 来 只 有 一 个 名 称 为 va_alist 的 int 
型 参数 。 


这 个 例子 实际 上 隐 含 了 如 下 假定 : 底层 的 C 语 言 实现 要 求 函数 参数 在 内 存 中 
连续 存储 ， 这 样 我 们 只 需 知道 当前 参数 的 地 址 ， 就 能 依次 访问 参数 列表 中 的 其 他 
参数 。 因 此 ， 在 varargs.h 的 这 个 实现 中 ，va_list 束 只 是 一 个 简单 的 字符 指针 。 宏 
va_start 把 它 的 参数 设置 为 va_alist 的 地 址 (为 避免 lint 程 序 的 警告 ， 这 里 做 了 类 型 
转换 ) ， 而 宏 va_end 则 什么 也 不 做 。 


最 复杂 的 宏 是 va_arg。 它 必须 返回 一 个 由 va_list 所 指 辐 的 恰当 类 型 的 数值 ， 同 
时 递增 va_list， 使 它 指向 参数 列表 中 的 下 一 个 参数 〈 即 递增 的 大 小 等 于 与 va_arg 宏 
所 返回 的 数值 具有 相同 类 型 的 对 象 的 长 度 ) 。 因 为 类 型 转换 的 结果 不 能 作为 赋值 
运算 的 目标 (译注 : 即 只 能 先 赋值 再 进行 类 型 转换 ， 而 不 能 先 类 型 转换 再 赋 
值 ) ， 所 以 va_arg 宏 首先 使 用 sizeof 来 确定 需要 递增 的 大 小 ， 然 后 直接 把 它 加 到 
va_list 上 ， 这 样 得 到 的 指针 再 被 转换 为 要 求 的 类 型 。 因 为 该 指针 现在 指向 的 位 
置 “ 过 ”了 一 个 类 型 单位 的 大 小 ， 所 以 我 们 使 用 了 下 标 -1 来 存 取 正确 的 返回 参数 。 


这 里 有 一 个 “陷阱 ”需要 避免 :va_arg 宏 的 第 二 个 参数 不 能 被 指定 为 char、short 
或 float 类 型 。 因 为 char 和 short 类 型 的 参数 会 被 转换 为 int 类 型 ， 而 float 类 型 的 参数 会 
被 转换 为 double 类 型 。 如 果 错 误 地 指定 了 ， 将 会 在 程序 中 引起 麻烦 。 


例如 ， 这 样 写 肯定 是 不 对 的 : 


c = va_arg(ap, char); 

因为 我 们 无 法 传递 一 个 char 类 型 参数 ， 如 果 传 递 了 ， 它 将 会 被 自动 转换 为 int 
类 型 。 上 面 的 代码 应 该 写成 : 
c = va_arg(ap,int); 

男 一 方面 ， 如 果 cp 是 一 个 字符 指针 ， 而 我 们 又 需要 一 个 字符 指针 类 型 的 参 
数 ， 下 面 这 样 写 就 完全 正确 : 
cp = va_arg(ap,char *); 


当 作为 参数 时 ， 指 针 并 不 会 被 转换 ， 只 有 char、short 和 float 类 型 的 数值 才 会 
被 转换 。 


我 们 还 应 该 注意 到 ， 不 存在 任何 内 建 的 方式 来 得 知 给 定 的 参数 数目 。 使 用 
varargs 系 列 宏 的 每 个 程序 ， 都 有 责任 通过 确立 某 种 约定 或 惯例 来 标志 参数 列表 的 
结束 。 例 如 ，Pprintf 函 数 使 用 格式 字符 串 作 为 第 一 个 参数 ， 来 确定 其 余 参 数 的 数目 


A.3 stdarg.h: ANSI 版 的 varargs.h 


头 文件 varargs.h 中 系列 宏 的 历史 最 早 可 退 溯 到 1981 年 ， 因 此 许多 C 语 言 实现 都 
对 其 提供 文 持 。 然 而 ，ANSI C 标 准 却 包括 了 男 一 种 不 同 的 机 制 ( 称 为 stdarg.h》， 
来 处 理 可 变 参数 列表 。 


7.1 节 中 的 讨论 ， 无 论 是 对 于 C 语 言 用 户 还 是 实现 人 员 ， 在 这 里 仍然 是 适用 
的 。 在 符合 ANSI C 标 准 的 编译 器 中 包括 varargs.h， 将 其 作为 功能 上 的 一 种 扩展 ， 
这 是 个 不 错 的 主意 ， 可 以 让 早期 的 程序 继续 运行 。 因 此 ， 在 编程 实践 中 ， 使 用 
varargsh 的 程序 比 使 用 stdarg.h 的 程序 可 移植 性 要 强 ， 能 够 运行 其 上 的 系统 平台 也 
要 多 一 些 。 但 如 果 你 要 编写 一 个 遵循 ANSI C 标 准 的 程序 ， 就 必须 使 用 stdarg.h， 而 
且 别 无 他 选 ! 这 是 一 个 让 人 左右 为 难 的 情形 ， 不 管 做 出 何 种 选择 ， 都 必须 付出 相 
应 代价 。 


我 们 观察 到 ， 有 具有 可 变 参 数列 表 的 函数 ， 它 们 的 第 1 个 参数 的 类 型 在 每 次 调 
用 时 实际 上 都 是 不 变 的 。varargs.h 和 stdarg.h 的 主要 区 别 就 来 自 于 这 一 事实 。 类 似 
printf 这 样 的 函数 ， 可 以 通过 检查 它 的 第 1 个 参数 ， 来 确定 它 的 第 2 个 参数 的 类 型 。 
但 是 ， 从 参数 列表 中 我 们 找 不 到 任何 信息 用 以 确定 第 1 个 参数 的 类 型 。 因 此 ， 使 
用 stdarg.h 的 函数 必须 至 少 有 一 个 固定 类 型 的 参数 ， 后 面 可 以 跟 一 组 未 知 数目 、 未 
知 类 型 的 参数 。 


作为 一 个 现成 的 例子 ， 让 我 们 再 来 看 一 下 error 函 数 。 它 的 第 1 个 参数 束 是 
printf 疯 数 中 的 格式 字符 串 ， 是 一 个 字符 指针 类 型 。 因 此 ，error 函 数 可 以 如 下 声 
明 : 


void error(char *, ...); 


那么 error 函 数 的 定义 又 是 怎样 呢 ? stdarg.h 头 文件 中 并 没有 varargsh 中 的 
va_arg 和 va_dcl 宏 。 使 用 stdarg.h 的 函数 直接 声明 其 固定 参数 ， 把 最 后 一 个 固定 参 


数 作为 va_start 宏 的 参数 ， 即 以 固定 参数 作为 可 变 参 数 的 基础 。 因 此 ，error 疯 数 的 
定义 如 下 所 示 : 


#include <stdio.h> 
#include <stdarg.h> 


void error(char *format, ...) 

{ 
va_list ap; 
va_start(ap, format); 
fprintf(stderr, "error: "); 
vfprintf(stderr, format, ap); 
va_end(ap); 
fprintf(stderr, "\n"); 


exit(1); 
} 
本 例 中 ， 我 们 无 须 使 用 va_arg 宏 ， 因 为 此 处 格式 字符 串 属于 参数 列表 的 固定 
部 分 。 


下 面 这 个 例子 演示 了 如 何 使 用 stdarg.h 来 编写 printf (其 中 用 到 了 vprintf》: 


#include <stdarg.h> 


int 
printf(char *format, ...) 
{ 

va_list ap; 

int n; 


va_start(ap, format) ; 

n = vprintf(format, ap); 
va_end(ap); 

return n; 


附录 B Koenig 和 Moo 夫 妇 访 谈 


作者 : Andrew Koenig、Barbara Moo 


【 译 者 注 】Andrew Koenig 和 Barbara Moo 夫 妇 是 C++ 领域 内 国际 知名 的 技术 
专家 、 技 术 作 家 和 教育 家 。 最 近 ， 他 们 的 几 部 著名 作品 《C++ 沉 思 录 》 
(Ruminations on C++) 、《C 隐 阱 与 缺陷 》 CC Traps and Pitfalls) #1 
《Accelerated C++ 中 文 版 》 即 将 问世 。 作 为 C++ View 的 成 员 和 《C++ 沉思 录 》 一 
书 的 技术 审 校 ， 我 与 C++ View 电 子 杂志 的 主编 王 曦 一 起 对 Koenig 夫 妇 进 行 了 一 次 
电子 邮件 形式 的 采访 。 下 面 是 这 次 采访 的 中 文 译 稿 。 


【Koenig 的 悄悄 话 】 你 们 问 的 问题 ， 我 们 已 经 答复 如 下 。 大 部 分 问题 我 们 都 
是 分 别 回答 的 ， 有 些 问 题 是 我 们 两 个 人 一 起 回答 的 ， 只 个 别 情况 是 一 个 人 作答 。 
我 们 是 在 尼亚加拉 瀑布 度假 期 间 完 成 这 次 采访 的 ， 我 脑子 里 一 直 在 想 ， 对 我 们 的 
中 国 读者 说 些 什 么 好 呢 ? 这 事 让 我 想 得 头疼 。 也 许 结束 度假 之 后 ， 我 们 能 说 得 更 
好 些 。 


提问 : 请 介绍 你 们 自己 的 一 些 情况 好 吗 ?“Koenig” 是 个 德国 姓氏 吗 ? 怎么 发 


音 呢 ? “Moo” We ? 


Koenig: “Koenig” 是 一 个 很 常见 的 德国 姓氏 ， 在 德 文 里 写成 “Konig”， 意 义 
是 “国王 ”(king) 。 不 过 我 的 情况 很 特殊 。 我 祖上 是 波兰 和 乌克兰 人 ， 不 是 德国 
人 。 这 个 名 字 其 实 是 一 个 长 长 的 波兰 姓氏 的 缩写 。 我 读 自己 名 字 的 时 候 ， 重 音 放 
在 前 面 的 音节 ， 整 体 的 音韵 类 似 “go” 的 发 音 。 而 一 些 与 我 同名 的 人 发 音 时 ， 第 一 


个 音节 的 音韵 类 似 “way” 的 有 发音， 我 们 家 里 人 从 来 不 这 么 说 。 


Moo: 谈 到 我 这 个 姓氏 ， 最 重要 的 一 点 就 是 ， 其 发 音 跟 牛 叫 的 声音 一 模 一 样 
一 一 当 我 还 是 孩子 的 时 候 ， 小 伙伴 们 经 常 模仿 牛 叫 声 来 取笑 我 。 我 父 辜 从 斯 堪 迪 
纳 维 亚 移民 来 到 美国 ， 这 个 姓 是 个 挪威 姓 。 我 在 自己 的 C++ 技术 生涯 中 最 快乐 的 
时 刻 之 一 ， 就 是 在 遇 到 Simula 阵 营 里 的 Kristen Nygaard 时 ， 他 告诉 了 我 这 个 姓氏 
的 起 源 。 他 说 这 个 姓氏 多 少 反 映 了 我 祖先 居住 的 地 方 一 一 Moo 是 一 个 很 少见 的 挪 
威 姓 氏 ， 其 意义 是 “元 芜 的 平原 "”， 既 不 是 亚 欧 大 陆 上 那 种 一 望 无 际 、 水 草 丰 诚 的 
大 草原 ， 也 不 是 沙漠 。 我 想 这 不 是 个 很 浪漫 的 姓氏 ， 不 过 能 够 跟 祖先 联系 起 来 ， 
还 是 很 有 趣 的 。 


顺便 一 提 ， 中 国 读者 可 能 会 对 以 下 事实 感 兴趣 。 很 多 人 在 见 到 我 之 前 ， 都 以 
为 我 是 中 国人 。 我 甚至 收 到 过 来 自 中 国 的 电话 推销 ， 和 希望 我 去 中 国 作 一 次 远程 旅 
行 ， 认 祖 归 宗 。 


提问 : Stanley Lippman 在 Inside the C++ Object Model 一 书 中 提 到 了 贝尔 实验 
室 的 Foundation 项 目 ， 他 这 么 说 : “这 是 一 个 很 令 人 激动 的 项 目 ， 不 仅仅 因为 我 们 
所 作 的 事情 令 人 激动 ， 而 且 我 们 的 团队 同样 令 人 激动 : Bjarne. Andy Koenig, 
Rob Murray. Martin Carroll, Judy Ward. Steve Buroff 和 Peter Juhl， 当 然 还 有 我 自 
己 。 除 了 Bjame 和 Andy 之 外 ， 所 有 的 人 都 归 Barbara Moo 管 理 。 她 经 常 说 ， 管 理 一 
个 软件 开发 团队 ， 就 像 放 牧 一 群 骄傲 的 猫 。” 请 问 ， 这 上 段 与 Bjame 和 其 他 人 共事 的 
日 子 ， 对 你 们 三 位 真 的 那么 美好 吗 ? 


Koenig: 那 一 段 日 子 在 我 看 来 不 过 是 我 长 达 15 年 的 C++ 生 涯 中 的 一 部 分 ， 而 
Foundation 项 目 里 的 人 也 只 不 过 是 一 个 更 大 社 群 中 的 一 部 分 。 当 时 我 已 经 开始 在 
标准 委员 会 中 开展 工作 ， 所 以 我 不 仅 要 与 同一 屋檐 下 的 人 讨论 ， 还 要 经 常 与 全 世 
界 各 地 的 数 十 位 C++ 程序 员 互 相交 流 。 


Moo: 我 倒是 更 喜欢 当年 围绕 Cfront 的 那 段 工作 经 历 。Cfront 是 最 早 的 C++ 编 


译 占 ， 那 是 一 个 伟大 的 团队 ， 而 且 我 们 处 于 一 个 新 语言 的 创造 中 心 ， 一 种 新 的 更 
好 的 工作 方法 的 创造 中 心 。 那 是 一 段 令 人 激动 的 时 光 ， 我 将 永远 保存 在 记忆 里 。 


提问 : 作为 C++ 标准 委员 会 的 项 目 编辑 ， 哪 件 事情 最 令 您 激动 ? 我 们 都 知 
道 ， 是 您 鼓励 Alex Stepanov 问 标准 委员 会 提交 STL， 并 建议 将 其 并 入 标准 库 。 关 
于 这 个 传奇 故事 ， 您 还 能 向 我 们 透露 一 些 细节 吗 ? 


Koenig: 当时 Barbara 和 我 跑 到 位 于 加 州 帕 洛 阿 尔 托 的 斯 坦 福 大 学 去 教授 一 星 
期 的 C++ 课程 。 当 时 Alex Stepanov 在 惠普 实验 室 工 作 ， 也 在 由 洛 阿 尔 托 ， 我 们 以 
前 在 AT&T 共 事 过 ， 所 以 对 他 以 前 的 工作 有 所 了 解 。 很 自然 地 ， 我 们 邀请 他 共 进 
午餐 。 席 间 他 非常 兴奋 地 提起 他 和 他 的 同事 正在 开发 的 一 个 C++ 库 。 


不 久之 后 ， 标 准 委员 会 在 圣何塞 开会 ， 那 里 距离 由 洛 阿尔 托 只 有 不 到 一 小 时 
车 程 。 我 觉得 Alex 的 想法 实在 很 有 意思 ， 就 邀请 他 给 标准 委员 会 的 成 员 讲 了 一 
课 。 我 们 都 觉得 ， 当 时 标准 化 的 工作 已 经 十 分 接近 完成 ， 他 的 工作 不 可 能 对 标准 
构成 什么 影响 。 但 是 ， 我 们 至 少 应 该 让 委员 会 成 员 知道 它 的 存在 ， 起 码 以 后 我 们 
可 以 说 STL 是 被 拒 了 ， 而 不 是 我 们 孤 陋 嘉 闻 ， 致 有 遗 珠 之 憾 。 


那 次 交流 会 是 我 所 参加 过 的 技术 报告 中 最 令 人 激动 的 几 个 之 一 。 在 长 长 的 一 
天 之 后 ， 会 议 接近 结束 时 ， 一 半 人 已 经 疲惫 不 坊 一 一 可 是 Alex 的 精力 极其 充沛 ， 
而 且 他 的 思想 如 此 先进 ， 大 大 超越 我 们 以 前 见 过 的 任何 东西 。 因 此 ， 当 会 议 快 结 
束 时 ， 委 员 们 开始 认真 地 讨论 是 否 应 该 将 这 个 库 并 入 C++ 标准 。 


当然 ， 后 来 这 个 库 就 被 渐渐 纳入 标准 ， 但 其 实际 过 程 还 是 相当 惊险 的 。 有 好 
几 次 至 关 重 要 的 投票 ， 都 可 能 把 它 扼杀 掉 。 有 一 次 ， 程 序 库 子 委员 会 甚至 决定 投 
票 拒绝 考虑 Alex 的 建议 ， 境 好 我 及 时 指出 ， 我 们 通常 的 议事 规程 是 ， 先 解决 旧 的 
议题 ， 然 后 再 考虑 新 的 议题 ， 束 算是 准备 拒绝 建议 ， 也 不 应 该 违例 。 我 们 围绕 
Alex 的 建议 展开 了 大 量 的 讨论 ， 最 后 ， 终 于 有 足够 多 的 人 改变 了 主意 ， 促 使 委员 
会 逐渐 接受 了 它 。 


提问 : 你 们 二 位 对 于 现在 的 C++ 教育 状况 怎么 看 ? 我 们 是 否 应 该 更 加 重视 标 
准 库 教育 ， 而 不 是 语言 细节 的 教育 ? 或 者 你 们 有 别 的 看 法 ? 


Koenig: 当前 C++ 的 教育 状况 实在 太 糟 糕 了 。 很 多 所 谓 的 C++ 教材 不 过 是 C 语 
言 书 ， 只 是 在 结尾 粘贴 一 点 点 C++ 的 材料 而 已 。 结 果 呢 ， 他 们 告诉 读者 ， 字 符 串 
力 是 定 长 字符 数组 ， 应 该 用 标准 库 中 的 strcpy 和 stremp 来 操作 。 一 个 程序 员 一 旦 在 
一 开始 掌握 了 这 些 东 西 ， 就 会 根深 带 回 ， 多 年 挥 之 不 去 。 就 其 本 里 而 言 ，C++ 是 
一 种 非常 低级 的 语言 ， 唯 有 利用 库 才 能 写 出 高 层次 的 程序 来 。 初 学 者 还 不 能 自己 
构造 库 ， 所 以 他 们 要 么 用 现成 的 标准 库 ， 要 么 自己 去 写 低层 次 的 程序 。 确 实 有 不 
少 程序 应 该 用 低层 次 技术 来 构造 ， 但 是 对 于 初学 者 不 合适 。 


Moo: 当然 是 库 优 于 语言 细节 ， 这 有 两 个 原因 : 首先 ， 学 生 可 以 不 必 寓 力 包 
装 低层 次 的 语言 细节 ， 从 而 更 容易 建立 整体 语言 的 全 局 观念 ， 了 解 到 其 真实 威 
力 。 根 据 我 们 的 经 验 ， 学 生 在 掌握 如 何 使 用 程序 库 之 后 ， 就 会 很 容易 理解 类 的 概 
念 ， 学 会 如 何 构造 类 的 技术 。 如 果 首 先 去 学 习 语言 细节 ， 那 么 就 很 难 理解 类 的 概 
念 及 其 功能 。 这 种 理解 上 的 缺陷 使 他 们 很 难 设 计 和 构造 自己 的 类。 


不 过 ， 更 重要 的 一 点 是 ， 首 先 学 习 程序 库 ， 能 够 使 学 生 培 养 起 民 好 的 习惯 ， 
就 是 复 用 库 代 码 ， 而 不 是 凡事 自己 动手 。 首 先 学 习 语 言 细节 的 学 生 ， 最 后 的 编程 
风格 往往 是 C 类 型 的 ， 而 不 是 C++ 风格 。 他 们 不 会 充分 地 运用 库 ， 而 自己 的 程序 
市 有 严重 的 C 主 义 倾 问 一 一 指针 满天飞 ， 整 个 程序 都 是 低层 次 的 。 结 果 是 ， 在 很 
多 情况 下 ， 你 为 C++ 的 复杂 性 付出 了 高 昂 代 价 ， 却 没有 从 中 获得 任何 好 处 。 


提问 : 在 《C++ 沉思 录 》 中 ， 你 们 提 到 : “C++ 和 希望 面 对 把 实用 性 放 在 首位 的 
社 群 。” 不 过 在 实践 中 ， 很 多 程序 员 都 在 抱 忽 ， 要 形成 一 个 好 的 C++ 设 计 实 在 是 太 
难 了 ， 他 们 党 得 Java 甚 至 老式 的 C 语 言 都 比 C++ 更 为 实用 。 这 种 看 法 有 什么 错误 
吗 ? 你 们 对 奉行 实用 主义 的 C++ 程序 员 有 何 建议 ? 


Koenig: 你 们 中 国人 有 没有 类 似 这 样 的 谚语 : EMF SAH TEA o 


的 工具 ? ”还 有 一 句 ,“ 当 你 手 里 拿 着 锤子 的 时 候 ， 整 个 世界 都 成 了 钉子 。” 编 程 问 
题 彼此 不 同 。 在 我 看 来 ， 就 一 个 问题 产生 良好 的 设计 方案 的 途径 ， 就 是 使 用 一 种 
允许 你 进行 各 种 设计 的 工具 。 这 样 一 来 ， 你 就 可 以 选择 最 适合 该 问题 的 设计 方 
案 。 如 果 你 选择 了 这 样 的 工具 ， 那 么 你 就 必须 负责 选择 合适 的 设计 方案 。 


Moo: 关于 这 个 问题 ， 我 想 用 一 个 项 目的 实例 来 说 明 ， 那 是 AT&T 最 早 采 用 
C++ 开 发 的 一 个 项 目 。 他 们 在 写 一 个 已 经 建成 的 系统 的 第 2 版 ， 所 以 认为 对 问题 域 
己 经 有 足够 深入 的 了 解 。 他 们 估计 学 习 C++ 是 整个 工作 中 比较 困难 的 一 部 分 。 然 
而 实际 上 ， 他 们 在 开发 中 发 现 ， 他 们 对 问题 领域 并 没有 很 好 的 理解 ， 于 是 花费 了 
大 量 的 时 间 来 形成 正确 的 抽象 。 设 计 是 很 困难 的 ， 语 言 问 题 相 对 容易 得 多 。 我 们 
相信 ，C++ 在 运行 时 性 能 上 做 了 一 个 很 好 的 折 中 ， 能 够 在 “一 切 都 是 对 象 "的 语言 
与 “避免 任何 抽象 ”的 语言 之 间 取 得 恰到好处 的 平衡 。 这 就 是 C++ 的 实用 性 。 


提问 : 有 一 点 看 起 来 你 们 与 几乎 所 有 的 C++ 技术 作家 意见 不 同 。 其 他 人 都 高 
声 宣扬 ， 面 向 对 象 编 程 乃 是 C++ 最 重要 的 一 面 。 而 你 们 认为 模板 才 是 最 重要 的 。 
我 仔细 阅读 了 《C++ 沉思 录 》 中 有 关 OOP 的 章节 ， 发 现 你 们 所 给 出 的 几 个 例子 和 
解决 方案 在 某 些 方面 是 很 相似 的 。 你 们 是 否认 为 所 有 “ 民 好 ”的 面向 对 象 解决 方案 
都 具有 某 种 共同 的 特质 ? 是 否 在 很 多 情况 下 ，OO 都 不 如 其 他 的 风格 ? 为 什么 认 
为 “基于 对 象 " 和 “基于 模板 ”的 抽象 机 制 优先 于 面向 对 象 抽象 机 制 ? 


Koenig: 所 谓 面 向 对 象 编程 ， 就 是 使 用 继承 和 动态 绑 定 机 制 编程 。 如 果 你 知 
道 有 一 个 很 好 的 程序 使 用 了 继承 和 动态 绑 定 ， 你 能 做 出 怎样 的 推 晰 ? 在 我 们 看 
来 ， 这 意味 着 该 程序 中 有 两 个 或 两 个 以 上 的 类 型 ， 至 少 有 一 个 共同 的 操作 ， 也 至 
少 有 一 个 不 同 的 操作 。 否 则 ， 就 不 需要 继承 机 制 。 此 外 ， 程 序 中 必然 有 一 个 场 
景 ， 需 要 在 运行 时 从 这 些 类 型 中 挑选 出 一 个 ， 否 则 就 不 需要 动态 绑 定 机 制 。 再 考 
虑 到 我 们 所 举 的 例子 必须 足够 短小 精怪 ， 能 够 放 在 一 本 书 里 ， 还 不 能 让 读者 烦 
心 ， 所 以 对 我 们 来 说 ， 很 难 在 所 有 这 些 限制 条 件 下 想 出 很 多 不 同 的 程序 范例 。 


某 些 面 向 对 象 编程 语言 ， 如 Python， 其 所 有 类 型 都 是 动态 的 ， 那 么 技术 图 书 


的 作者 就 不 会 面 对 这 样 的 问题 。 例 如 ，C++ 中 的 容器 类 大 多 数 用 模板 写成 ， 因 其 
可 以 容纳 毫 无 共同 之 处 的 对 象 ， 所 以 要 求 元 素 类 型 必须 是 从 个 共同 基 类 的 派生 类 
室 无 道理 。 然 而 ， 在 Python 中 ， 容 器 类 中 本 来 就 可 以 放置 任何 对 象 ， 所 以 类 似 模 
板 那样 的 类 型 机 制 就 不 必要 了 。 


所 以 ， 我 认为 你 所 看 到 的 问题 ， 其 实 古 因为 很 难 找到 又 小 又 好 的 面向 对 象 程 
序 来 做 范例 ， 才 会 产生 的 。 而 且 ， 对 于 其 他 语言 必须 烦 劳动 态 类 型 才能 解决 的 问 
题 ，C++ 能 够 使 用 模板 来 高 效 地 解决 。 


Moo: 我 同意 ， 我 们 写 的 东西 让 你 很 容易 地 得 出 上 述 结论 。 但 是 在 这 个 特例 
里 ， 我 们 所 写 的 东西 并 不 能 代表 我 们 的 全 部 观点 。 我 们 针对 C++ 写 了 很 多 的 介绍 
性 和 提高 性 的 材料 。 在 这 本 书 里 ，“ 基 于 对 象 设计 ”中 的 抽象 机 制 就 已 经 很 难 掌握 
了 ， 而 又 必须 在 介绍 面向 对 象 方法 之 前 讲 清楚 。 所 以 ， 我 们 所 写 的 东西 实际 上 是 
想 展示 这 样 的 观点 ， 除 非 你 首先 掌握 了 构造 良好 类 的 技术 ， 否 则 急 急忙 忙 去 研究 
继承 就 是 振 苗 助长 。 


男 一 个 因素 是 ， 我 们 希望 用 例子 来 推进 我 们 的 教学 。 奉 要 展示 良好 的 面向 对 
象 设计 ， 问 题 可 能 会 变 得 很 复杂 。 这 种 例子 没 法 很 快 掌握 ， 也 不 适合 本 书 的 风 
格 。 


提问 : 如 果 说 我 只 能 记 住 你 的 一 句 话 ， 那 一 定 是 这 句 :“ 用 类 来 表示 概 
念 。” 你 在 《C++ 沉 思 录 》 中 反复 强调 这 人 句 话 ， 给 我 留 下 了 极其 深刻 的 印象 。 假 设 
我 能 再 记 住 一 句 话 ， 你 们 觉得 应 该 是 什么 ? 

Koenig & Moo: “避免 重复 "。 如 果 你 发 现 自己 在 程序 的 两 个 不 同 部 分 中 做 了 
相同 的 事情 ， 则 试 着 把 这 两 个 部 分 合并 到 一 个 子 过 程 中 。 如 果 你 发 现 两 个 类 的 行 
为 相近 ， 则 试 着 把 这 两 个 类 的 相似 部 分 统一 到 基 类 或 模板 中 。 


提问 : 你 们 在 《C++ 沉思 了 录 》 中 有 两 句 名 言 :“ 类 设计 就 是 语言 设计 ， 语 言 设 
计 就 是 类 设计 。” 你 们 对 C++ 标 准 库 的 未 来 如 何 看 待 ” 人 们 是 应 该 开发 更 多 的 实用 


组 件 ， 比 如 boost::thread 和 regex++， 还 是 继续 激进 前 行 ， 支 持 不 同 的 风格 ， 像 
boost::lambda 和 boost::mpl 所 做 的 那样 ? 


Koenig: 我 觉得 现在 回答 这 个 问题 还 为 时 尚 早 。 从 根本 上 讲 ，C++ 语 言 反 映 
了 其 社 群 的 状况 ， 而 当前 整个 社 群 中 各 种 声音 都 有 。 我 看 还 需要 一 段 时 间 才 能 达 
成 共识 ， 确 定 发 展 的 方 癌 。 


提问 : 有 时 ， 编 写 平 台 无 关 的 C++ 程序 比较 困难 ， 而 且 开 发 效率 也 不 能 满足 
需求 。 你 是 否认 为 把 C++ 与 其 他 的 语言 ， 尤 其 类 似 Python 和 TCL/TK 那 样 的 脚本 语 
言 合并 使 用 是 个 好 主意 ? 


Koenig: 是 的 。 我 最 近 在 学 习 Python， 得 出 的 看 法 是 ，Python 和 C++ 构成 了 
完美 的 一 对 组 合 。Python 程 序 比 相应 的 C++ 程序 短小 精 悍 ， 而 C++ 程序 则 比 Python 
运行 速度 要 快 得 多 。 因 此 ， 我 们 可 以 用 C++ 来 构造 那些 对 性 能 要 求 很 高 的 部 分 ， 
然后 用 Python 把 它们 粘 在 一 起 。Boost 中 的 一 个 作者 Dave Abrahams 写 了 一 个 很 不 
错 的 C++ 库 ， 很 好 地 处 理 了 C++ 与 Python 的 接口 问题 ， 我 认为 这 是 一 个 好 的 想法 。 


提问 : 你 们 的 著名 作品 《C 陷阱 与 缺陷 》、《C++ 沉 思 录 》 和 《Accelerated 
C++ 中 文 版 》 即 将 问世 。 想 对 你 们 的 中 国 读者 说 些 什么 ? 


Koenig & Moo: 我 们 应 该 保持 谦虚 ， 有 很多 人 已 经 从 我 们 的 书 中 学 到 了 一些 
东西 。 我 们 很 高 兴 将 会 有 一 个 很 大 的 群体 成 为 我 们 读者 群 的 一 部 分 ， 希 望 你 们 从 
书 中 有 所 收获 。 


提问 : 我 在 你 们 的 主页 上 看 到 不 少 漂 亮 的 照片 。 你 们 有 没有 访问 中 国 的 计 
划 ? 那 一 定 可 以 让 你 们 拍 到 更 多 的 好 照片 。 


Koenig: 几乎 所 有 的 照片 都 是 用 一 架 中 型 照相 机 拍摄 的 ， 它 又 大 又 重 ， 以 至 
于 在 1995 年 的 有 一 次 旅行 时 ， 我 们 被 禁止 把 它 带 上 飞机 。 当 然 ， 现 在 飞机 对 行李 
的 控制 更 加 严格 了 ， 所 以 我 觉得 不 太 可 能 带 着 这 台 相 机 去 中 国旅 游 。 现 在 我 只 在 


车 程 范围 内 进行 严肃 的 艺术 摄影 。 


提问 : 最 后 一 个 问题 ， 我 们 都 希望 成 为 更 好 的 C++ 程序 员 。 请 给 我 们 3 个 你 们 
认为 最 重要 的 建议 ， 好 吗 ? 


Koenig & Moo: 
1. 避免 使 用 指针 。 
2. 提倡 使 用 程序 库 。 


3. 使 用 类 来 表示 概念 。 


